Apple bugün yapay zeka dünyasının en iyi isimlerinden biri değil, ancak şirketin görüntü düzenlemeye yönelik yeni açık kaynaklı yapay zeka modeli, bu alana ne kadar katkıda bulunabileceğini kanıtladı.
Görüntüleri işlerken metin tabanlı komutları yorumlamak için çok modlu büyük dil modellerini (MLLM’ler) kullanan MLLM Kılavuzlu Görüntü Düzenleme isimli model piyasaya sürüldü. Basitçe anlatmamız gerekirse, bu araç, kullanıcının yazdığı metne göre fotoğrafları düzenleme yeteneğine sahip. Bunu yapabilen ilk araç olmasa da, daha gelişmiş özellikler sunması ile öne çıkan model şimdiden ilgi topladı. Şirket, MGIE’yi Santa Barbara’daki Kaliforniya Üniversitesi’nden araştırmacılarla geliştirdi. MLLM’ler denen programlar basit metinleri, fotoğraf düzenleyicinin izleyebileceği daha ayrıntılı ve net talimatlara dönüştürme gücüne sahip. Örneğin, bir kullanıcı biberli pizzanın fotoğrafını “daha sağlıklı hale getirmek” için düzenlemek isterse, MLLM’ler bunu “sebze malzemeleri ekleyin” olarak yorumlayabilir ve fotoğrafı bu şekilde düzenleyebilir. Yapay zeka geliştikçe beraberinde endişeler de artıyor diyebiliriz. Bir şeyin ne kadar gerçek olup olmadığını ayırt etmek artık oldukça zor olacak. Apple da bu alanda yerini göstermeye başladı. Şirketin yeni AI modeli şimdiden dikkatleri üstüne topladı desek yanlış olmaz. Kullanıcıların da gündeminde olacak olan bu model yavaş yavaş kullanıma sunulacak.
Kaynak: TELE1