Hugging Face açık robotik projesini başlattı

amerikali

Yeni Üye
Açık yapay zeka platformu Hugging Face bir sonraki iddialı projesini başlatıyor: açık robotik ortamı. X'te (eski adıyla Twitter) duyurduğu gibi, bilim adamı Remi Cadene'nin bunu yapması bekleniyor. Cadene daha önce Tesla'da otopilot ve genel amaçlı insansı robot Optimus'un geliştirilmesi üzerinde çalışıyordu. Bilimsel olarak zekanın altında yatan mekanizmalarla ve özellikle de yapay sinir ağlarını kullanarak insan davranışlarının kopyalanmasıyla ilgileniyor. Bu amaçla yeni mimarileri, öğrenme yöntemlerini, teorik çerçeveleri ve özellikle yapay zeka sistemlerinin sonuçlarını ve karar verme süreçlerini açıklanabilir hale getirmeye yönelik yaklaşımları araştırıyor.

Reklamcılık



Hugging Face, yeni proje için şimdiden başka bir pozisyonun reklamını yaptı: Açık kaynak ve derin öğrenmeye dayalı, uygun maliyetli bir robotik sistem geliştirecek bir robotik mühendisi arıyor. Görevleri arasında, diğer şeylerin yanı sıra, hareket planlama ve kontrolün yanı sıra algı ve navigasyona yönelik algoritmaların geliştirilmesi de yer alacak.

Mantıksal bir sonraki adım


Huggingface, 2016 yılında kurulduğundan bu yana açık makine öğrenimi sistemlerinin geliştirilmesi, değişimi ve kıyaslaması için mükemmel bir platform haline geldi. Altyapı aynı adı taşıyan Fransız-Amerikan şirketi tarafından işletiliyor. Önemli bir hizmet, Huggingface kullanıcılarına görüntü, metin ve ses görevleri için açık kaynaklı model uygulamaları sağlayan Transformers kütüphanesidir. 2021'de Huggingface, OpenAI, Meta veya Google'ın tescilli dil yapay zekalarını dengelemek amacıyla açık kaynaklı bir LLM (Büyük Dil Modeli) geliştirmek üzere BigScience girişimini başlattı. Bir yıl sonra, bağımsız araştırmacılar ve küçük şirketlerden oluşan ağ, 176 milyar parametreli BLOOM modelini sundu.

Hugging Face, planlanan robot projesiyle bir sonraki mantıklı adımı atıyor. Makine tarafından eğitilen sistemler giderek daha çok modlu hale geliyor; bu, giderek daha fazla türde giriş verisini aynı anda işleyip bunları farklı şekillerde çıktı olarak verdikleri anlamına geliyor. Şu anda öncelikle görüntüleri ve metni birleştiriyorlar, ancak ses, video ve sensör verileri de giderek daha fazla multimodal modellerin eğitimine dahil ediliyor. Çok modlu yapay zekaların merkezi yapı taşı, GPT veya LLaMA gibi büyük dil modelleridir, çünkü zaten oldukça kapsamlı dünya bilgisini içselleştirmişlerdir ve çoğu zaman bunu şaşırtıcı derecede iyi uygulayabilirler. Bu nedenle robot bilimi, kullanıcılardan gelen kısa talimatları robotlar için ayrıntılı akış şemalarına dönüştürmeyi amaçlayan Yüksek Lisans (LLM) ile giderek daha fazla deney yapıyor.


(atr)



Haberin Sonu