కృత్రిమ మేధ గుండె కాయ

కృత్రిమ మేధ.. కృత్రిమ మేధ.. కృత్రిమ మేధ. శాస్త్ర, సాంకేతిక రంగాల్లో ఎక్కడ చూసినా ఈ పేరే మార్మోగుతోంది.

Updated : 28 Feb 2024 07:10 IST

కృత్రిమ మేధ.. కృత్రిమ మేధ.. కృత్రిమ మేధ. శాస్త్ర, సాంకేతిక రంగాల్లో ఎక్కడ చూసినా ఈ పేరే మార్మోగుతోంది. ఛాట్‌జీపీటీ, జెమినీ వంటి ఛాట్‌బాట్లు.. మిడ్‌జర్నీ, డాల్‌-3 వంటి జనరేటివ్‌ ఏఐ టూల్స్‌.. సోరా వంటి వీడియో జనరేటర్లు సృష్టిస్తున్న సంచలనం అంతా ఇంతా కాదు. పదాల ఆదేశాలతోనే పనులను చేసి పెడుతూ.. మనం చేయాల్సిన పనులను సులభం చేస్తూ.. చేదోడు వాదోడుగా నిలుస్తున్నాయి. మున్ముందు ఇవి పెను విప్లవాలకు శ్రీకారం చుట్టే అవకాశమూ ఉంది. ఇలాంటి జనరేటివ్‌ ఏఐ టూల్స్‌ను నడిపించేది.. వీటన్నింటిన్నింటికీ గుండె కాయ ఏంటో తెలుసా? ఎల్‌ఎల్‌ఎం గానీ పిలుచుకునే లార్జ్‌ లాంగ్వేంజ్‌ మోడల్‌.  

 ఎల్‌ఎల్‌ఎం కథేంటి?

 ఓపెన్‌ ఏఐ సంస్థ సంచలనాత్మక ఛాట్‌జీపీటీని ఆవిష్కరించినప్పటి నుంచీ అంతటా కృత్రిమ మేధ గురించే చర్చ. ఇళ్లలో, బడుల్లో, ఆఫీసుల్లో, పరిశ్రమల్లో అందరూ దీని గురించే మాట్లాడుకోవటం. కంప్యూటర్లను ఆవిష్కరించిన కొత్తలో అవి కేవలం పరికరాలే. ప్రోగ్రామ్‌లు ఇచ్చే సూచనలను పాటించటం వరకే వీటి పని. కానీ ఇప్పుడు కంప్యూటర్లు నేర్చుకోవటం మొదలెట్టాయి. ఆలోచించటం, మనుషులతో మాట్లాడటమూ అలవరచుకుంటున్నాయి. అంతేకాదు.. మనుషులకు మాత్రమే సాధ్యమైన సృజనాత్మక, మేధో పరమైన పనులెన్నింటినో చిటికెలో చేసేస్తున్నాయి. అంతా జనరేటివ్‌ ఏఐ మహత్తు. రాతలో తర్వాత వచ్చే పదం లేదా వాక్యాన్ని అంచనా వేయటమంటే మాటలు కాదు. దీనికి ఎంతో ‘తెలివి’ అవసరం. ఇక్కడే ఎల్‌ఎల్‌ఎంలు జనరేటివ్‌ ఏఐ మోడళ్లకు తోడ్పడుతున్నాయి. గుర్తించాల్సిన విషయం ఏంటంటే- జనరేటివ్‌ ఏఐ టూల్స్‌ అన్నీ ఎల్‌ఎల్‌ఎంలతో రూపొందినవి కావు. కానీ ఎల్‌ఎల్‌ఎంలన్నీ జనరేటివ్‌ ఏఐ రూపాలే. ఇది రోజురోజుకీ విస్తరిస్తున్న ఒకరకం కృత్రిమ మేధ. అందువల్ల ఛాట్‌జీపీటీల సామర్థ్యం వెనకున్న రహస్యాన్ని అర్థం చేసుకోవాలంటే ఎల్‌ఎల్‌ఎంలను అవగతం చేసుకోవాల్సి ఉంటుంది.

ఎల్‌ఎల్‌ఎం అంటే?

ఒక్కమాటలో చెప్పుకోవాలంటే- భారీ భాషా సూత్రాలు. ఆయా పనులు నిర్వర్తించేలా వీటికి ముందుగా శిక్షణ ఇవ్వచ్చు. అనంతరం మెరుగుపరచనూ వచ్చు. టెక్స్ట్‌ను వర్గీకరించటం, ప్రశ్నకు సమాధానం ఇవ్వటం.. అలాగే టెక్స్ట్‌ను సృష్టించటం, డాక్యుమెంట్ల సారాంశాన్ని గుదిగుచ్చి అందించటం వంటి ఎన్నో పనులకు ఉపయోగపడతాయి. ఆర్థికం, వినోదం వంటి పలు రంగాల్లో ఎదురయ్యే సమస్యలనూ పరిష్కరించగలవు. ఎల్‌ఎల్‌ఎంను ప్రధానంగా మూడు భాగాలుగా విభజించొచ్చు. ఒకటి లార్జ్‌. పేరుకు తగ్గట్టుగానే దీనికి పెద్దమొత్తం డేటాతో శిక్షణ ఇస్తారు. రెండు హైపర్‌ పారామీటర్స్‌ సంఖ్య. ఇది మెషిన్‌ లెర్నింగ్‌కు తోడ్పడే సాధనం. మోడళ్లతో మెషిన్‌కు శిక్షణ ఇచ్చేటప్పుడు ఆయా అంశాలను నేర్చుకోవటానికి, గుర్తుంచుకోవటానికి ఈ హైపర్‌పారామీటర్స్‌ తప్పనిసరి. ఎల్‌ఎల్‌ఎంలో మరో ముఖ్యమైన విషయం వివిధ అవసరాలకు ఉపయోగపడటం (జనరల్‌ పర్పస్‌). అంటే తరచూ ఎదురయ్యే సమస్యలను పరిష్కరించే సామర్థ్యం కలిగుండటం. ఇది నిర్దేశిత పనులు, పరిమిత వనరులతో సంబంధం లేకుండా మనుషులు మాట్లాడే, అర్థం చేసుకునే భాషా సారూప్యతతో పనిచేస్తుంది. మొత్తమ్మీద ఎల్‌ఎల్‌ఎం సూపర్‌ కంప్యూటర్‌ పోగ్రామ్‌ వంటిదని అనుకోవచ్చు. ఇది మనిషిలా టెక్స్ట్‌ను సృష్టించగలదు, క్రోడీకరించగలదు. ప్యాటర్న్‌లు, స్ట్రక్చర్లు, భాషా సంబంధాలతో కూడిన భారీ డేటా సెట్స్‌తో శిక్షణ తీసుకొని.. కంప్యూటర్లకు మనం మాట్లాడే మాటలను అర్థం చేసుకునేలానే కాకుండా, వాటిని సృష్టించే సామర్థ్యాలనూ కట్టబెట్టటం దీని ప్రత్యేకత.

ఎన్నెన్నో రకాలు

ఎల్‌ఎల్‌ఎంలు రకరకాలు. చేసి పెట్టే పనులను బట్టి వీటిని వివిధ రకాలుగా వర్గీకరించొచ్చు. ఆర్కిటెక్చర్‌ పరంగా చూస్తే ఆటోరిగ్రెసివ్‌, ట్రాన్స్‌ఫార్మర్‌ బేస్డ్‌, ఎన్‌కోడర్‌-డీకోడర్‌ మోడళ్లుగా విభజించుకోవచ్చు. ఆటోరిగ్రెసివ్‌ మోడల్‌కు జీపీటీ-3 మంచి ఉదాహరణ. ఇది ముందరి పదాల క్రమం ఆధారంగా తర్వాత వచ్చే పదాన్ని ఊహిస్తుంది. భాష వర్గీకరణకు తోడ్పడే న్యూరల్‌ నెట్‌వర్క్‌ నిర్మాణంతో కూడినవేమో ట్రాన్స్‌ఫార్మర్‌ బేస్డ్‌ మోడళ్లు. ఇటీవల గూగుల్‌ పరిచయం చేసిన జెమినీ (ఒకప్పటి బార్డ్‌) దీనికి ఉదాహరణగా చెప్పుకోవచ్చు. ఇక ఎన్‌కోడర్‌-డీకోడర్‌ మోడళ్లేమో.. ఇన్‌పుట్‌ టెక్స్ట్‌ సూచనను ఎన్‌కోడ్‌ చేసి, దాన్ని మరో భాష లేదా ఫార్మాట్‌లోకి డీకోడ్‌ చేస్తాయి. శిక్షణ కోసం వాడే డేటాను బట్టి- ఎల్‌ఎల్‌ఎంలను మరో మూడు రకాలుగా విభజించొచ్చు. శిక్షణకు సిద్ధంగా ఉన్నవి (ప్రిట్రెయిన్డ్‌), మెరుగు పరచినవి (ఫైన్‌-ట్యూన్డ్‌), బహభాషలకు సంబంధించినవి (మల్టీలింగ్వల్‌). ఈ మోడళ్లు పలు భాషల్లోని అక్షరాలను అర్థం చేసుకోగలవు, సృష్టించగలవు. వీటిని న్యాయం, ఆర్థికం, ఆరోగ్యరంగం వంటి ఆయా రంగాలకు సంబంధించిన డేటాతో శిక్షణ ఇచ్చి డొమైన్‌ మోడళ్లుగానూ తీర్చిదిద్దొచ్చు. ఎల్‌ఎల్‌ఎంలను భారీ సైజులోనూ రూపొందించొచ్చు. వీటికి మరింత పెద్దమొత్తంలో గణన వనరులు అవసరం. ఇవి ఇంకాస్త ఎక్కువ నైపుణ్యాన్నీ ప్రదర్శిస్తాయి. అందుబాటులో ఉండటాన్ని బట్టి- ఓపెన్‌ సోర్స్‌, క్లోజ్డ్‌ సోర్స్‌గానూ ఎల్‌ఎల్‌ఎంలను వర్గీకరించుకోవచ్చు. కొన్ని ఉచితంగా అందుబాటులో ఉంటే కొన్ని ఆయా సంస్థల ఆధీనంలో ఉంటాయి. ఎల్‌ఎల్‌ఏఎంఏ2, బ్లూమ్‌, గూగుల్‌ బెర్ట్‌, ఫాల్కన్‌ 180బి, ఓపీటీ-175 వంటివన్నీ ఓపెన్‌ సోర్స్‌ ఎల్‌ఎల్‌ఎంలు. క్లాడ్‌ 2, బార్డ్‌, జీపీటీ-4 వంటివి సంస్థల ఆధీనంలో ఉండే ఎల్‌ఎల్‌ఎంలు.

 

ఎలా పనిచేస్తాయి?

ఎల్‌ఎల్‌ఎంలు ఎలా పనిచేస్తాయి? ఇవి మనిషి మెదడులా ఎలా ఆలోచిస్తాయి? ఎవరికైనా ఆసక్తి కలిగించే ప్రశ్నలివి. అసలు ఒక పరికరం లేదా మెషిన్‌ మనిషిలా ఆలోచించటమేంటి? అని చాలామంది విస్తుపోతుంటారు కూడా. ఎల్‌ఎల్‌ఎంల పనితీరును విశ్లేషిస్తే నిజంగానే ఆశ్చర్యం కలుగుతుంది. వీటిల్లో నిక్షిప్తమైన ముఖ్యమైన టెక్నిక్‌ ‘డీప్‌ లెర్నింగ్‌’. ఇది కృత్రిమ నాడీ అనుసంధానాల శిక్షణతో ముడిపడి ఉంటుంది. కృత్రిమ నాడీ అనుసంధానాలనేవి గణిత నమూనాలు. వీటికి స్ఫూర్తి మనిషి మెదడు నిర్మాణాలు, పనులే. ఈ న్యూరల్‌ నెట్‌వర్క్‌లు వాక్యంలో ముందరి పదాల ఆధారంగా తర్వాత వచ్చే పదాలు లేదా వాక్య స్వరూపాన్ని అంచనా వేస్తాయి. ఇందుకు గణిత సూత్రాల మీద ఆధారపడతాయి. ఉదాహరణకు- ఒకటి, ఒకటి కలిపితే రెండు అవుతుంది కదా. ఇదే పద్ధతిలో ఆయా వాక్యాల స్వరూపాలను, పదాల మధ్య సంబంధాన్ని అర్థం చేసుకుంటాయి. ఇంటర్నెట్‌లో ఏదైనా సెర్చ్‌ చేస్తున్నప్పుడో, మెయిల్‌ రాస్తున్నప్పుడో తర్వాత వచ్చే పదాలు, వాక్యాల సిఫారసులు గమనించే ఉంటారు. ఇదీ ఎల్‌ఎల్‌ఎం సామర్థ్యానికీ ఉదాహరణే. శిక్షణ కోసం ఉపయోగించిన డేటాలోని పదాల మధ్య సంబంధాలు, తీరుతెన్నులను ఇది విశ్లేషిస్తుంది. సునిశిత శిక్షణ ఇస్తే చాలు. ప్రాంప్ట్‌ల ఆధారంగా తర్వాత వచ్చే పదాలు, పదాల వరుసను అంచనా వేస్తాయి. ఒకరకంగా పిల్లలు మాటలను నేర్చుకుంటున్నట్టుగానే ఎల్‌ఎల్‌ఎం కూడా నేర్చుకుంటుందన్నమాట. ఇమేజ్‌ జనరేటర్లయితే ప్రాంప్ట్‌ల ఆధారంగా ఆయా చిత్రాలనూ ఊహించి, ఒక రూపాన్ని ముందుంచుతాయి. ఒకవేళ ఆయా రేఖలు తప్పయితే అనంతరం సరిదిద్దుకొని, మెరుగవుతాయి.

ఎలా ఉపయోగపడతాయి?

ఎల్‌ఎల్‌ఎంలు వివిధ రంగాల్లో పలు రకాలుగా ఉపయోగపడతాయి. ఇవి టెక్స్ట్‌ను సృష్టించగలవు. కథల దగ్గరి నుంచి కథనాల వరకూ.. కవిత్వం దగ్గరి నుంచి పాటల వరకూ మనుషుల మాదిరి కంటెంట్‌ను పుట్టించగలవు. సిరి వంటి వర్చువల్‌ అసిస్టెంట్‌గా మన మాటలకు స్పందించగలవు. మాటలకు అనుగుణంగా పనులు చేసిపెట్టగలవు. ఎంత ఎక్కువ డేటాతో శిక్షణ ఇస్తే ఇవి అంత గొప్పగా భాషా నైపుణ్యాన్ని సాధిస్తాయి. సెంటిమెంట్‌ విశ్లేషణ, భాష అనువాదం, టెక్స్ట్‌ సంక్షీప్తీకరణ వంటి పనులను ఇట్టే చేయగలవు. సంభాషణ పరంగానూ యూజర్లు వేసే ప్రశ్నలకు సమాధానం ఇవ్వగలవు. కంటెంట్‌ను క్రియేట్‌ చేయటంలోనూ కీలక పాత్ర పోషిస్తాయి. మార్కెటింగ్‌ వ్యూహాలు, ఆయా వ్యక్తుల ఇష్టాయిష్టాలను బట్టి వస్తువులను సిఫారసు చేయటం, ప్రేక్షకుల అభిరుచుల మేరకు కంటెంట్‌ను విడదీయటం (యూట్యూబ్‌లో తర్వాతి వీడియోను చూపటం) వంటి పనులనూ చేసిపెడతాయి.

వైవిధ్యమే పెద్ద ప్రయోజనం

ఎల్‌ఎల్‌ఎంల అతిపెద్ద ప్రయోజనం వీటి వైవిధ్యమే. ఒక్క మోడల్‌తోనే వేర్వేరు పనులు చేయించొచ్చు. భారీ డేటాతో శిక్షణ తీసుకోవటం వల్ల ఉద్దేశించిన పనులకే కాకుండా తర్వాత  పలురకాల పనులకూ ఉపయోగపడేలా మలచుకోవచ్చు. నిరంతరం సామర్థ్యాన్ని మెరుగుపరచుకునేలా ఉండటం మరో ప్రత్యేకత. వీటికి డేటా, పారామీటర్స్‌ను అందించినకొద్దీ నైపుణ్యాన్ని సంతరించుకుంటాయి, మెరుగవుతాయి. ఇవి రోజురోజుకీ కొత్త కొత్త రంగాల్లోకీ విస్తరిస్తున్నాయి. కాబట్టి భవిష్యత్తులో మనిషికి సాధ్యం కాని ఎన్నో ఆవిష్కరణలను సాధ్యం చేసినా ఆశ్చర్యపోనవసరం లేదు. ఎల్‌ఎల్‌ఎంలతో కూడిన జనరేటివ్‌ ఏఐ మున్ముందు మరింతగా విస్తరించే అవకాశముంది. రోజువారీ పనులను సులభతరం చేయనుంది. ఇప్పటికే దీని ఫలితాలను చవి చూస్తున్నాం కూడా.

  •  రాత ప్రతులను, మాటలను ఒక భాష నుంచి మరో భాషలోకి అనువదించటం తేలిక కానుంది. గూగుల్‌ ట్రాన్స్‌లేట్‌ వంటి సాధనాలు ఇప్పటికే దీన్ని సుసాధ్యం చేస్తున్నాయి. ఛాట్‌బాట్‌లోకి టెక్స్ట్‌ను ఎంటర్‌ చేసి, అనువాదం చేయమని ఆదేశిస్తే చాలు. ఇతర భాషల అక్షర రూపంలోకి మార్చేస్తాయి. అప్పటికప్పుడు మాట్లాడుతున్న మాటలను అనువాదం చేయటమూ సాధ్యమవుతోంది.
  •  గూగుల్‌ గత సంవత్సరంలో సెక్‌పామ్‌ అనే సైబర్‌ సెక్యూరిటీ ఎల్‌ఎల్‌ఎంను పరిచయం చేసింది. ఇది మాల్వేర్‌ విశ్లేషణ చేస్తుంది. గూగుల్‌ వైరస్‌ టోటల్‌ కోడ్‌ ఇన్‌సైట్‌ దీని ఆధారంగానే ఫైళ్లను స్కాన్‌ చేసి మాల్వేర్‌ ఉందో, లేదో తెలియజేస్తుంది. ఇలాంటి ఎల్‌ఎల్‌ఎంలు భారీ డేటాతో శిక్షణ తీసుకుంటాయి కాబట్టి మొత్తం నెట్‌వర్క్‌నూ తేలికగా జల్లెడ పట్టగలవు. సైబర్‌ దాడులనూ గుర్తించి, అప్రమత్తం చేయగలవు. సెంటినెల్‌వన్‌ అనే సంస్థ రూపొందించిన ఎల్‌ఎల్‌ఎం ఆధారిత సొల్యూషన్‌ దీనికి మంచి ఉదాహరణ. ఇది తనకు తానే ముప్పులను అన్వేషించి, దాడి జరిగే అవకాశముంటే ఆటోమేటిక్‌గా హెచ్చరిస్తుంది.
  •  జనరేటివ్‌ ఏఐ టూల్స్‌ జావాస్క్రిప్ట్‌, పైథాన్‌, పీహెచ్‌పీ, జావా వంటి భాషల్లో కోడ్స్‌నూ రాయగలవు. టెక్నికల్‌ పరిజ్ఞానం మీద పట్టులేకున్నా బేసిక్‌ కోడ్స్‌ను సృష్టించుకోవచ్చు. ప్రస్తుతం వాడుతున్న కోడ్స్‌లో బగ్స్‌నూ గుర్తించగలవు.
  •  లార్జ్‌ లాంగ్వేజ్‌ మోడళ్లు యూజర్ల టెక్స్ట్‌ ఇన్‌పుట్‌ లేదా డేటాసెట్‌ను ప్రాసెస్‌ చేసి ట్రెండ్స్‌ సారాంశాన్ని రాయగలవు. కొనుగోలుదారుల తీరుతెన్నులు, పోటీ ఇస్తున్న వస్తువులు, మార్కెట్‌ వ్యత్యాసాలు వంటి వాటికి సంబంధించిన సమాచారాన్నీ ఇవ్వగలవు. ఇలా మార్కెట్‌ రీసెర్చ్‌కు తోడ్పడగలవు. వ్యాపారాల అభివృద్ధికి, వినూత్న వస్తువుల తయారీకి అనుగుణమైన సూచనలు చేయగలవు.
Tags :

గమనిక: ఈనాడు.నెట్‌లో కనిపించే వ్యాపార ప్రకటనలు వివిధ దేశాల్లోని వ్యాపారస్తులు, సంస్థల నుంచి వస్తాయి. కొన్ని ప్రకటనలు పాఠకుల అభిరుచిననుసరించి కృత్రిమ మేధస్సుతో పంపబడతాయి. పాఠకులు తగిన జాగ్రత్త వహించి, ఉత్పత్తులు లేదా సేవల గురించి సముచిత విచారణ చేసి కొనుగోలు చేయాలి. ఆయా ఉత్పత్తులు / సేవల నాణ్యత లేదా లోపాలకు ఈనాడు యాజమాన్యం బాధ్యత వహించదు. ఈ విషయంలో ఉత్తర ప్రత్యుత్తరాలకి తావు లేదు.

మరిన్ని