लार्ज ल्याङ्ग्वेज मोदल
लार्ज ल्याङ्ग्वेज मोदल बाय् वृहत भाषा मोडल (Large Language Model वा LLM) धाःगु आर्तिफिसियल इन्तेलिजेन्स(AI) या छगू ताजि ख, गुकियात तःधंगु मात्राय् तेक्स्त देता (text data) छ्यलाः प्रशिक्षण बियातःगु जुइ। थ्व मोदल नाप मनूतय्सं ल्हाइगु भाषा थुइकेगु, च्वयेगु, अले लिसः बिइगु क्षमता दइ। थन्यागु मोदलतय्सं अर्बौं प्यारामीटर (parameters) छ्यलाः भाषाया संरचना व खँग्वःतय्गु स्वापू सीका काइ। आःया इलय् थ्व प्रविधिं च्वसु च्वयेगु, कम्प्युटर प्रोग्रामिङ यायेगु, अले भाय् हिला बिइगु ज्याय् क्रान्ति हे हयाच्वंगु दु। थ्व मोडलत दीप लर्निंग (deep learning) अले न्यूरल नेटवर्क (neural networks) सिद्धान्तय् आधारित जुइ। विशेष यानाः 'ट्रान्सफर्मर' (Transformer) आर्किटेक्चरया विकासं थ्व क्षेत्रय् तःधंगु सफलता हःगु ख। थुकियात अर्बौं खँग्वःत दूगु डाटासेटय् स्यनिगु जुइ, गुकिया कारणं थुकिसं जटिल/थाकूगु न्ह्यसःतय्गु लिसः नं अपुइकः बी फु। थ्व प्रविधिं भविष्यय् मनू व मेसिन दथुया संचारयात पूवंक हे हिलाबिइगु अनुमान याःगु दु।
इतिहास व विकास
[सम्पादन]लार्ज ल्याङ्ग्वेज मोदलया विकास प्राकृतिक भाषा प्रसंस्करण (NLP) या ख्यलय् दशकौँ न्ह्यवंनिसें जुयाच्वंगु अनुसन्धानया लिच्वः ख। न्हापाया मोदलत 'नियम' (rules) व 'सांख्यिकी' (statistics) य् आधारित जुल, गुकिया क्षमता सीमित जक दत। सन् २०१७ य् गुगलया अनुसन्धानकर्तातय्सं "Attention Is All You Need" नांया शोधपत्र सार्वजनिक यायेधुंका 'ट्रान्सफर्मर' मोडलया उदय जुल। थ्व मोदलया विकासं एआईयात खँग्वःतय्गु दथुइ दूगु ताःहाकःगु स्वापूयात बांलाक थुइकेगु क्षमता बिल।
सन् २०१८ पाखे ओपनएआई (OpenAI) संस्थां न्हापांगु GPT (Generative Pre-trained Transformer) सार्वजनिक यात। थ्व धुंका मोडलतय्गु आकार व क्षमताय् तीव्र गतिं वृद्धि जुल। सन् २०२० य् सार्वजनिक जूगु GPT-3 मोडल नं हलिमय् थ्व प्रविधियात लोकंह्वाकल। थ्व मोडलय् १७५ अर्ब प्यारामीटरत दूगु ख, गुगु उगु इलय् दकलय् तःधंगु मोडल ख। वया लिपा गुगल, मेटा, अले मेमेगु प्रविधि कम्पनीलतय्सं नं थःथःगु वृहत मोडलत सार्वजनिक यात।
ज्या यायेगु पहः
[सम्पादन]लार्ज ल्याङ्ग्वेज मोदलतय्सं मू रूपं 'प्रेडिक्शन' (prediction) वा 'अनुमान' या आधारय् ज्या याइ। छुं नं खँत्वाः दुने छगू खँग्वः धुंका मेगु छु खँग्वः वइ धका थ्व मोदलतय्सं तथ्याङ्कया आधारय् अनुमान याइ। थ्व प्रक्रियायात 'नेक्स्ट टोकन प्रेडिक्शन' (Next Token Prediction) धाइ।
थ्व मोदलया प्रशिक्षण प्रक्रिया क्वय् बियाकथंया चरणय् जुइ:
- डाटा मुंकेगु: इन्टरनेट, सफू, विकिपिडिया अले मेमेगु स्रोतं अर्बौं खँग्वःत मुंका ट्रेनिंग डाटा दयेकीगु।
- प्रि-ट्रेनिंग (Pre-training): मोदलयात अन्लेबलद् डाटा (unlabelled data) बिइगु, गुकिया पाखें मोदलं भाषाया व्याकरण व साधारण ज्ञान सीकी।
- फाइन-ट्यूनिंग (Fine-tuning): मोदलयात विशिष्ट ज्या (दसु: लिसः बिइगु, कोडिङ यायेगु) यायेत विशिष्ट डाटासेटय् हाकनं तालिम बिइगु।
- RLHF (Reinforcement Learning from Human Feedback): मनूतय्सं मोदलया लिसःयात मुल्यांकन यानाः वयागु गुणस्तर बांलाकेगु ज्या।
| मोदलया नां | दयेकामि | मुख्य विशेषता |
|---|---|---|
| GPT | OpenAI | उच्च तर्क क्षमता व मल्टिमोडल |
| Llama | Meta | ओपन सोर्स अले उच्च दक्षता |
| Claude | Anthropic | सुरक्षा व ताःहाकःगु सन्दर्भ थुइकेगु क्षमता |
| Gemini | गुगलया इकोसिस्टमलिसे एकीकरण |
छ्यला व उपयोगिता
[सम्पादन]लार्ज ल्याङ्ग्वेज मोदलया छ्यला थौंया ईलय् थीथी ख्यलय् जुयाच्वंगु दु। शिक्षाया ख्यलय् विद्यार्थीपिन्त जटिल विषय थुइकेत थुकियात छ्यलेछिं। सफ्टवेयर विकासय् प्रोग्रामरपिन्त कोड च्वयेत अले गल्ती (bugs) सुधार यायेत थुकिसं ग्वहालि याइ।
साहित्य अले च्वयेगु ख्यलय् च्वसु, चिनाखँ, अले ई-मेल च्वयेत थ्व मोदलत तसकं प्रभावकारी जुयाच्वंगु दु। व्यापारिक क्षेत्रय् ग्राहक सेवा (Customer Service) या निंतिं 'च्याटबोट' (Chatbots) या रूपय् थुकिया छ्यला जुइ। तथ्यांक विश्लेषण व सारांश (summarization) दयेकीगु ज्याय् नं थुकिया तःधंगु ल्हा दु। भाय् हिला बिइगु (Translation) ज्याय् थ्व मोदलतय्सं न्हापाया प्रविधि स्वया अप्वः स्वाभाविक लिसः बिइ फु।
चुनौती व सीमा
[सम्पादन]थ्व प्रविधिया यक्व फाइदा दुसां छुं गम्भीर समस्यात नं दु। दकलय् तःधंगु समस्या 'हलुसिनेसन' (Hallucination) ख, गुकिया अर्थ मोदल नं पूवंक हे मखूगु वा काल्पनिक सूचंयात तथ्य कथं न्ह्यब्वयेगु ख। थ्व नापं डाटाया पूर्वाग्रह (Bias) मेगु छगू तःधंगु समस्या ख। यदि मोदलयात स्यनिगु डाटाय् पक्षपात दुसा, मोडलया लिसः नं पक्षपातपूर्ण जुइफु।
गोपनीयता (Privacy) या विषय नं थुकिलि महत्वपूर्ण चुनौती दु। मोदलयात स्यनिबिलय् छ्यलामिया व्यक्तिगत सूचं सुरक्षित दइ कि मदइ धइगु खँय् विवाद दु। थ्व नापं तःधंगु मोडलतय्सं तसकं अप्वः ऊर्जा खपत याइ, गुकिया कारणं वातावरणीय प्रभाव नं लाः।
भविष्य
[सम्पादन]लार्ज ल्याङ्ग्वेज मोदलया भविष्य 'मल्टिमोडालिटी' (Multimodality) पाखे वनाच्वंगु दु। थुकिया अर्थ मोडलतय्सं पाठ (text) जक मखुसे, किपा, सः, अले भिडियो नं थुइकेगु अले दयेकीगु यायेगु क्षमता दयेकाहःगु दु। एआई एजेन्ट (AI Agents) या रूपय् थ्व मोदलतय्सं मनूया प्रत्यक्ष निर्देशन विना हे जटिल ज्या याये फइगु अनुमान दु।
थ्व क्षेत्रय् जुयाच्वंगु अनुसन्धानं मोदलतय्सं याकनं हे 'तर्क' (Reasoning) यायेगु क्षमता नं दयेकाहःगु दु। थुकिलिं वैज्ञानिक अनुसन्धान अले चिकित्सा विज्ञानय् न्हूगु आविष्कार यायेत ग्वहालि याइ। अथेसां, थ्व प्रविधियात नियमन यायेगु (Regulation) अले सुरक्षित तवरं छ्यलेगु चुनौती नं सरकार व समाज न्ह्यःने लाःवइ।