Yerli teknoloji şirketi geliştirdiği Türkçe büyük dil modelini kamuoyuyla paylaştı. Model, metin üretme, soru yanıtlama ve özetleme görevlerinde başarılı sonuçlar verdi. Bu gelişme, Türkiye'nin teknoloji bağımsızlığı yolundaki en somut adımlarından biri olarak değerlendiriliyor.

Şirket yetkililerine göre model, 150 milyar parametre üzerine inşa edildi ve Türkçe'deki deyimler ile kültürel bağlamı kavramada yüksek başarı gösterdi. Bu parametre sayısı, modeli dünya genelinde parmakla sayılan büyük dil modelleri arasına sokuyor.

Eğitim ve Veri Kümesi

Modelin eğitimi için 2 milyar kelimeden oluşan Türkçe metin korpusu kullanıldı. Veri kümesi; gazete arşivleri, akademik yayınlar, sosyal medya ve el kitapları gibi geniş bir yelpazeden derlendi. Eğitim süreci yaklaşık 6 ay sürdü. İki yüzü aşkın yüksek performanslı GPU kullanılarak yapılan hesaplamalar, yerli enerji yatırımcılarıyla ortaklaşa kurulu bir veri merkezinde gerçekleştirildi. Bu, şimdiye kadar oluşturulan en büyük Türkçe veri kümelerinden biri.

Kıyaslama Sonuçları

Test aşamasında model, Türkçe NLP kıyaslamalarında mevcut açık kaynaklı modelleri geride bıraktı. Özellikle soru-cevap, özetleme ve duygu analizi görevlerinde yüksek doğruluk oranları elde edildi. Şirket, modeli önce kurumsal kullanıcılara sunacak; ardından 50 pilot kurumun geri bildirimlerine göre iyileştirerek kamuya açık API olarak sunacak.