Google'ın "Akıllı Video Uygulama Programlama Arayüzü" adını verdiği  yeni teknoloji, şirketin bulut bilişim birimi Google Cloud'un ABD'nin San  Francisco şehrinde düzenlediği "Next" konferansında kamuoyuna duyuruldu.

Yeni teknolojinin, bir video arşivindeki tüm görüntülerde yer alan  nesneleri tek tek kaydederek, bunları daha sonra anahtar sözcüklerle arayıp,  nesnelerin yer aldığı sahneleri otomatik olarak seçebilen uygulamalar üretmeye  olanak sağlayacağı belirtildi.

Google'da "Geliştirici temsilcisi" olarak görev yapan Sara Robinson'ın  konferans sırasında yaptığı sunumda programın uygulama arayüzüne yüklenen bir  videonun birbirini izleyen sahnelerindeki dağ manzarası, kır evi, şehir, cadde,  köpek, garaj gibi nesne ve kavramları görüntülerin akışıyla eş zamanlı olarak  anahtar sözcükler olarak kaydettiği görüldü.

Robinson, sonraki adımda geniş bir video arşivi içinde belirli bir  nesneye odaklanan aramalar yaptı. "Beyzbol" anahtar sözcüğüyle yapılan aramada,  saatlerce uzunluktaki video arşivi içinden beyzbol topu, şapkası ve maç  görüntülerinin olduğu sahneler, "plaj" anahtar sözcüğüyle yapılan aramada ise  odağında veya fonunda plaj görüntülerinin bulunduğu sahneler otomatik olarak  seçilip, listelendi.

Google Cloud'un Yapay Zeka ve Makine Öğrenme Birimi baş araştırmacısı Fei-Fei Li, günümüzde piksellerin dünyasının hareketsiz imajların çok ötesine  geçtiğini vurgularken, yeni teknolojinin video içeriklerinde kavramsal aramayı  mümkün kılması sayesinde makine öğrenme teknolojilerine geniş bir saha açacağını  ifade etti.

İmaj tanıma teknolojileri bugüne dek yalnızca hareketsiz resimlere  uygulanabiliyordu.