Yapay zeka modelleri, internet kullanıcılarının CAPTCHA testlerinden oyunlara, navigasyon verilerine kadar her hareketinden besleniyor. Peki bu veri toplama süreçleri gizlilik ve güvenlik endişeleri yaratıyor mu?
Büyük dil modelleri (LLM) ChatGPT, Gemini ve Claude gibi yapay zeka teknolojileri, her gün milyonlarca kullanıcı tarafından metin üretimi için kullanılıyor. Bu modellerin eğitimi, kitaplar, internet siteleri ve diğer yazılı materyallerden elde edilen metinlerle gerçekleştiriliyor. Son dönemde ise bu eğitim sürecinin, internet kullanıcılarının çevrim içi hareketlerinden veri derlenmesine odaklandığı tartışmaları yoğunlaşıyor.
İnternet hizmetlerine erişimden önce kullanıcıların insan olduğunu teyit eden CAPTCHA ve reCAPTCHA testleri, teknoloji firmaları için güvenlik önleminin ötesinde bir anlam taşıyor. Kullanıcılardan görseldeki harfleri yazması veya belirli nesneleri tanıması istenen bu testlerin, yapay zeka araçlarının eğitiminde kullanıldığı öne sürülüyor.
Google’ın reCAPTCHA testlerinde sıkça yaya geçitleri, trafik lambaları ve taşıtlar gibi nesnelerin sorulması, bu verilerin yapay zeka destekli otonom araçlar için kullanıldığı iddialarına yol açtı. Bir Google Cloud sözcüsü, reCAPTCHA kullanıcı verilerinin yalnızca hizmeti iyileştirme amacıyla kullanıldığını ve hizmet şartlarında bu durumun açıkça belirtildiğini ifade etti.
Yapay zeka eğitiminde gündelik kullanımların rolü, Pokemon Go gibi oyunlara ve navigasyon uygulamalarına kadar genişliyor. Niantic’in Pokemon Go oyunu, oyuncuların cep telefonlarındaki GPS ve kameralar aracılığıyla gerçek dünyada karakterler arayışıyla büyük bir görsel veri havuzu oluşturdu.
MIT Technology Review’e göre, Niantic Spatial şirketi bu 30 milyar görseli kullanarak gerçek dünyanın sanal bir modelini üretti. Firma, bu teknolojiyle GPS’in güvenilir olmadığı yerlerde robotların hareketini kolaylaştırmayı hedefliyor. Niantic, Kasım 2024’te yaptığı açıklamada, oyuncuların sunduğu verilerin kullanıldığını doğruladı ancak bu özelliğin tamamen opsiyonel olduğunu vurguladı.
İsviçre Lozan Üniversitesi’nden Profesör Christian Peukert, yapay zeka eğitiminde kullanılan materyaller ile kullanıcı güvenliği ve mahremiyeti arasındaki dengeyi değerlendirdi. Peukert, eski CAPTCHA versiyonlarında kullanıcıların tanıdığı kelimelerle birlikte bilinmeyen bir kelimeyi deşifre etmeye çalıştığını, bilinmeyen kelimeye verilen yanıtın ise dijitalleştirme çabaları kapsamında veri olarak depolandığını belirtti. Bu durumun, kullanıcıların metin tanıma sistemlerinin iyileştirilmesine doğrudan katkıda bulunduğu anlamına geldiğini vurguladı.
Peukert, Reddit ve Twitter gibi sosyal medya platformlarının dil modellerini, Instagram’ın görsel verilerini, Google aramalarının dil anlama sistemlerini ve Google Haritalar ile Waze gibi navigasyon uygulamalarının hareket verilerini yapay zeka eğitimi için kullandığını kaydetti. Ayrıca, sohbet robotları ve sesli asistanlarla yapılan görüşmelerin de kayıt altına alınarak sistemleri iyileştirmede kullanıldığını ekledi.
Profesör Peukert, bu veri birikiminin ‘fişleme’, ‘sahte içerik üretimi’ ve ‘kullanıcıların kendileriyle rekabet eden sistemleri beslemesi’ gibi gizlilik ve güvenlik sorunlarına yol açabileceğini ifade etti. Bireysel önlemlerin yetersiz kalacağını belirten Peukert, eğitim için kullanılan verilerin büyük veri kümelerine dahil edildiğinde kontrolünün zorlaştığını belirtti. Ancak Peukert, insan kaynaklı verilerin dil teknolojileri, çeviri, erişilebilirlik araçları ve arama motorları gibi alanlarda faydalar sağladığına da işaret etti.
Türkiye ve dünya gündemine dair en güncel haberler, ekonomi dünyasındaki son gelişmeler, spor camiasından sıcak haberler ve teknoloji dünyasındaki yenilikler Gündem Zamanı ile parmağınızın ucunda. Tarafsız yayıncılık ilkesiyle, son dakika haberleri ve derinlemesine analizleri anlık olarak sizlere ulaştırıyoruz.
Yorum Yap