Türk mühendislerin geliştirdiği yerli yapay zeka modeli Kumru, VNGRS adlı teknoloji girişimi tarafından geliştirildi. 7,4 milyar parametre kapasitesiyle önce dil işleme, özetleme ve soru-cevap görevlerinde ChatGPT benzeri performans hedefliyor.

Kumru’nun öne çıkan özelliklerinden biri, 16 GB VRAM’e sahip tüketici GPU’larında bile çalışabilmesi. Bu durum, yüksek donanım gerekmeksizin yaygın kullanım için önemli bir avantaj sağlıyor.

Modelin eğitim süreci de dikkat çekici: Kumru, Meta’nın LLaMA‑3 mimarisinden destek alarak, 45 günlük ön eğitim aşaması boyunca 500 GB verilik eğitim setiyle, 300 milyar token kullanılarak geliştirildi.

Ayrıca, Kumru’nun daha hafif versiyonu Kumru-2B de kullanıcılara sunuldu. Bu sürüm, 2 milyar parametre ile 4,8 GB bellekle çalışabiliyor ve mobil cihazlara uygun şekilde tasarlandı.

Kullanım, Ücret ve Tepkiler

Kumru, kullanıcılara ücretsiz erişim fırsatı sunuyor. kumru.ai adresinden erişilebilen model, aynı zamanda API aracılığıyla entegrasyona da açık durumda.

Ancak sosyal medyada bazı kullanıcılar, Kumru’nun verdiği hatalı ya da beklenmedik cevaplara dikkat çekiyor. Örneğin, basit bir toplama işlemini yanlış cevaplaması gibi hatalar modelin şu anki sınırlılıklarını gözler önüne serdi.

Uzmanlar, modelin bu tür hatalarının, büyük dil modellerinin hala karşılaştığı “halüsinasyon” problemiyle ilişkili olduğunu belirtiyor. Bu alanda geliştirme ve iyileştirmelerin süreç içinde daha fazla önem kazanacağı düşünülüyor.