Büyük Dil Modelleri (LLM), metinsel verilerle eğitilmiş geniş yapay zeka sistemleridir ve kendilerine sunulan çeşitli metinsel uyarıcıları işleyebilme kapasitesine sahiptirler. Bu uyarıcılar, İngiltere’nin başkenti nedir? gibi basit ve doğrudan sorgulardan başlayarak, karmaşık sorunların veya görevlerin ayrıntılı açıklamalarına kadar geniş bir yelpazede değişiklik gösterebilir. Büyük Dil Modelleri, bu tür metinsel uyarıcılara verilen yanıtları formüle ederken birçok dil ve bilgi kaynağını bir araya getirerek kullanıcılarının ihtiyaçlarını karşılamayı amaçlar. Ancak, bu modellerin yanıt üretirken tabi olduğu bazı kısıtlamalar bulunmaktadır. Bu kısıtlamalardan biri de belirteç (token) sınırlamasıdır.
Belirteçler, metinlerin daha küçük anlamlı parçalarına ayrılmış halidir. Örneğin, İngiltere’nin başkenti Londra’dır. cümlesi, kelimelere veya daha küçük birimlere bölünebilir ve bu birimlerin her biri birer belirteç olarak kabul edilir. Büyük Dil Modelleri’nin özellikle hizmet sunduğu belirli bir belirteç sınırı vardır. Bu sınır, modelin belirli bir yanıt oluştururken ne kadar metni işleyebileceğini belirler. Örneğin, bir modelin belirteç sınırı 1000 ise, bu model 1000 belirteçlik bir yanıt oluşturabilir. Bu sınırlamalar, modelin performansını ve doğruluğunu etkileyebilir. Örneğin, karmaşık bir yönerge veya sorunun yanıtlanması için daha fazla belirteç gerekebilir ve belirteç sınırını aşan durumlarda model, bilgiyi yeterince kapsamlı bir şekilde işleyemeyebilir.
Büyük Dil Modelleri’nin metinsel uyarıcıları işleyebilme yetenekleri, doğal dil işleme (NLP) teknikleriyle desteklenir. NLP, bilgisayarların insan dilini anlama, yorumlama ve üretme görevlerinde kullanılan bir alan olup, dil modelinin temel yapı taşıdır. Örneğin, bir kullanıcı bir tarayıcıda En yüksek dağ hangisidir? sorusunu sorduğunda, büyük dil modelinin görevi bu soruya en doğru yanıtı bulmaktır. Model, veri tabanındaki bilgiyi kullanarak Dünyanın en yüksek dağı Everest’tir. yanıtını verebilir. Bu yanıt, belirteç limiti içindeyse daha ayrıntılı da olabilir, örneğin Dünyanın en yüksek dağı Everest’tir ve yüksekliği 8848 metredir. gibi. Her iki durumda da model, girdiyi detaylı bir şekilde işleyip anlamlandırarak kullanıcıya faydalı bir yanıt sunar.