స్థానిక మేధ

కృత్రిమ మేధ (ఏఐ) తీరు మారుతోంది. ఆంగ్లం గడపను దాటుకొని స్థానిక భాషలపై దృష్టి సారిస్తోంది. ఆయా భాషల వైవిధ్యం, యాసలు, సంస్కృతులకు అనుగుణంగా రూపాంతరం చెందుతోంది.

Updated : 20 Dec 2023 01:34 IST

కృత్రిమ మేధ (ఏఐ) తీరు మారుతోంది. ఆంగ్లం గడపను దాటుకొని స్థానిక భాషలపై దృష్టి సారిస్తోంది. ఆయా భాషల వైవిధ్యం, యాసలు, సంస్కృతులకు అనుగుణంగా రూపాంతరం చెందుతోంది. ఎంతగొప్ప సాంకేతిక పరిజ్ఞానమైనా ప్రజలకు విస్తృతంగా అందుబాటులోకి వస్తేనే సార్థకత. అన్నిదేశాల పరిస్థితులు, అవసరాలు ఒకేలా ఉండవు. ఛాట్‌జీపీటీ వంటి ఏఐ పరిజ్ఞానాలు ఆంగ్లానికే పరిమితమైతే ఆ భాష తెలియనివారి మాటేమిటి? ఇదే సాంకేతిక నిపుణులను ఆలోచింపజేస్తోంది. స్థానికతకూ ప్రాధాన్యమివ్వటం అనివార్యమవుతోంది. మనలాంటి సువిశాల దేశానికిది అత్యంత అవసరం కూడా. ఇందుకోసం మనదేశంలో ప్రభుత్వంతో పాటు ప్రైవేటు సంస్థలూ ఎంతో కృషి చేస్తున్నాయి. ఎలక్ట్రానిక్స్‌ అండ్‌ ఇన్ఫర్మేషన్‌ టెక్నాలజీ మంత్రిత్వశాఖ (మీటీ) చేపట్టిన జాతీయ భాషా అనువాద ప్రాజెక్టు ‘భాషిణి’ ఇప్పటికే ఎంతో ముందడుగు వేసింది. ఇటీవల ఓలా సంస్థ కృత్రిమ్‌ అనే ఏఐ పరిజ్ఞానాన్ని పరిచయం చేయటం తెలిసిందే. ఈ నేపథ్యంలో స్థానిక భాషల్లో కృత్రిమ మేధ అవసరం, ప్రయత్నాలపై సమగ్ర కథనం మీకోసం.

  •  అది వారణాసిలో కాశీ తమిల్‌ సంగమం కార్యక్రమం. ప్రధానమంత్రి నరేంద్ర మోదీ ప్రసంగం. ఆయన హిందీలో మాట్లాడుతోంటే సభికులకు హెడ్‌ఫోన్‌లో తమిళంలో వినిపిస్తోంది. హిందీ అప్పటికప్పుడే తమిళంలోకి తర్జుమా అయ్యింది!
  • భాషిణి సీఈఓ అమితాబ్‌ నాగ్‌ ఇటీవల అందరి ముందు తన కుమార్తెకు యూపీఐ ద్వారా డబ్బులు పంపించారు. కేవలం ఫోన్‌కు మాటలతో ఆదేశాలు ఇవ్వటం ద్వారానే. అదీ హిందీలో మాట్లాడుతూ! దేశీయ భాషలోనూ ఆన్‌లైన్‌ సేవలు పొందటం సాధ్యమేనని ప్రత్యక్షంగా నిరూపించారు.

కృత్రిమ మేధలో స్థానిక భాషల ప్రయోగానికివి తాజా నిదర్శనాలు. ప్రయోగాల స్థాయిని దాటుకొని ఇప్పుడిప్పుడే ప్రజలకు చేరువవుతున్నాయి. అందరికీ అందుబాటులోకి వస్తే గణనీయమైన మార్పులకు శ్రీకారం చుట్టినట్టే.

 భాషా వైవిధ్యానికి మనదేశం పెట్టింది పేరు. మనదగ్గర 400కు పైగా భాషలు, యాసలున్నాయి. ఒక్క హిందీలోనే 48 యాసలను అధికారికంగా గుర్తించారు. బెంగాలీలో సుమారు 50 రకాలు కనిపిస్తుంటాయి. మన తెలుగు నేల మీద వేర్వేరు యాసల్లో మాట్లాడటం తెలిసిందే. కానీ కృత్రిమ మేధలో కీలకమైన ఎల్‌ఎల్‌ఎం(లార్జ్‌ లాంగ్వేజ్‌ మోడల్‌)లకు ప్రధానంగా ఇంటర్నెట్‌ డేటాతోనే శిక్షణ ఇస్తుంటారు. ఇది చాలావరకు ఆంగ్లంలోనే ఉంటుంది. వెబ్‌ కంటెంట్‌ విషయంలో అత్యధిక ఆదరణ పొందింది ఆంగ్లమే. సుమారు 59% వెబ్‌సైట్లు ఇంగ్లిష్‌లోనే ఉంటాయి. రెండో స్థానంలో రష్యన్‌ (5.3%), మూడో స్థానంలో స్పానిష్‌ (4.3%) నిలుస్తున్నాయి. డిజిటల్‌ వ్యత్యాసానికి ఇంతకన్నా నిదర్శనం ఇంకేం కావాలి? ఆంగ్లం కన్నా ప్రాంతీయ భాషల్లో ఏఐ నమూనాలకు ఎక్కువ శిక్షణ ఇవ్వాల్సిన అవసరముందనే విషయాన్ని ఇది చెప్పకనే చెబుతోంది. నిజానికి మనదగ్గర అంతర్జాల వాడకం తక్కువేమీ కాదు. ఇంటర్నెట్‌ అండ్‌ మొబైల్‌ అసోసియేషన్‌ ఆఫ్‌ ఇండియా గత సంవత్సరం విడుదల చేసిన నివేదిక ప్రకారమే మనదేశంలో 69.2 కోట్ల మంది తరచూ అంతర్జాలాన్ని వాడుతున్నారు. వీరిలో గ్రామీణులను తక్కువ అంచనా వేయటానికి లేదు. ఆ మాటకొస్తే పట్టణాల్లో కన్నా గ్రామాల్లోనే ఇంటర్నెట్‌ వాడకం ఎక్కువ! పట్టణ ప్రాంతాల్లో 34.1 కోట్ల మంది, గ్రామీణ ప్రాంతాల్లో 35.1 కోట్ల మంది అంతర్జాలాన్ని వాడుతున్నారు. వీరి సంఖ్య రోజురోజుకూ పెరుగుతూనే వస్తోంది. మనదేశంలో 2025 నాటికి 90 కోట్ల మంది ఇంటర్నెట్‌ను వాడొచ్చని అంచనా. ఈ పురోగతిలో వాయిస్‌ సేవలు, దేశీయ భాషలే కీలక పాత్ర పోషించనున్నాయని భావిస్తున్నారు. ఇక్కడే కృత్రిమ మేధ శిక్షణలో ప్రాంతీయ భాషలు ప్రాధాన్యం సంతరించుకుంటున్నాయి.


కృత్రిమ్‌ సంచలనం

ఇటీవల ఓలా సంస్థ మొట్టమొదటి పూర్తిస్థాయి దేశీయ కృత్రిమ మేధ సొల్యూషన్‌ ‘కృత్రిమ్‌ ఏఐ’ని పరిచయం చేసి సంచలనం సృష్టించింది. జీపీటీ-4, ఎల్‌ఎల్‌ఏఎంఏ-2తో కూడిన దీని ప్రత్యేకతలేంటో చూద్దాం.
పేరుకు తగినట్టుగా: దీని ప్రత్యేకత పేరులోనే కొట్టొచ్చినట్టు కనిపిస్తోంది. ఆర్టిఫిషియల్‌ అనే ఆంగ్ల పదానికి సంస్కృత పదమైన కృత్రిమ్‌ అతికినట్టు సరిపోతుంది. భారతీయ సంస్కృతి, భాషా వైవిధ్యాన్ని ఇది చెప్పకనే చెబుతోంది.
బహుభాషా నైపుణ్యం: కృత్రిమ్‌ 20 భారతీయ భాషలను అలవోకగా అర్థం చేసుకోగలదు. మరాఠీ, హిందీ, తెలుగు, కన్నడ, ఒడియాతో పాటు మొత్తం 10 భారతీయ భాషల్లో కంటెంట్‌ను సృష్టించగలదు. కృత్రిమ మేధలో భాషా సమ్మేళనం దిశగా ఇదో గొప్ప ముందడుగు కాగలదని భావిస్తున్నారు.
సంస్కృతికి ప్రాధాన్యం: భారతీయ ఘన వారసత్వాన్ని ప్రతిబింబించేలా కృత్రిమ్‌ను తీర్చిదిద్దారు. పాశ్చాత్య దేశాల డేటాతో శిక్షణ ఇచ్చే ఏఐ నమూనాలకు ఇది భిన్నమైందని భావిస్తున్నారు.
తీవ్ర శిక్షణ: కృత్రిమ్‌ ఏఐ నమూనాకు చాలా కఠినంగా శిక్షణ ఇచ్చారు. ఇందుకోసం 2 ట్రిలియన్ల పదాలను వాడుకున్నారు. ఇంత తీవ్రంగా శిక్షణ ఇవ్వటం మూలంగానే కృత్రిమ్‌ అన్నింటికన్నా ముందుండగలదని ఆశిస్తున్నారు. భారతీయ భాషలను సపోర్టు చేయటంలో ఇది జీపీటీ-4ను సైతం అధిగమించగలదని అనుకుంటున్నారు.
భారతీయ డేటాతోనే: ఇతర ఏఐ నమూనాలతో పోలిస్తే దీనికి 20 రెట్లు ఎక్కువగా భారతీయ భాషలతో శిక్షణ ఇచ్చారు. అందువల్ల భారతీయ సంస్కృతి, విలువలు, ఆకాంక్షలను ఇది లోతుగా అర్థం చేసుకోగలదు.
వాయిస్‌ యాక్టివేషన్‌: కేవలం అక్షరాలతోనే కాదు, మాటల రూపంలో  వచ్చే ఇన్‌పుట్స్‌కూ కృత్రిమ్‌ స్పందిస్తుంది. దీంతో ఇంటరాక్షన్‌, యాక్సెసబిలిటీ ఎక్కువగా ఉంటుంది. సంభాషణల సమయంలో ఇది రాత నుంచి మాటలకు.. అలాగే మాటల నుంచి రాతకు తేలికగా మారగలదు.
ప్రత్యక్ష కోడింగ్‌ సామర్థ్యం: ఆవిష్కరించే సమయంలోనే ఇది అప్పటికప్పుడు కోడింగ్‌ రాసే గుణమూ కలిగి ఉన్నట్టు నిరూపించుకుంది. డెవలపర్లు, పారిశ్రామిక వేత్తలకిది ఎంతగానో ఉపయోగపడనుంది.
త్వరలో కృత్రిమ్‌ ప్రో: వచ్చే నెలల్లో మరింత అధునాతనమైన కృత్రిమ్‌ ప్రో వర్షన్‌ను ఆరంభించటానికి ఓలా సన్నద్ధమవుతోంది. ఇది మరింత బాగా సమస్యలను పరిష్కరించగలదని, లక్ష్యాలను సాధించగలదని ఆశిస్తున్నారు.
వెబ్‌సైట్‌ అందుబాటులోకి: కృత్రిమ్‌ వెబ్‌సైట్‌ shttps://olakrutrim.com/z  ఆరంభమైంది. ఆసక్తి గలవారు వెయిట్‌ జాబితాలో నమోదు చేసుకోవచ్చు. దీని ప్రధాన ఎల్‌ఎల్‌ఎం మోడల్‌ వచ్చే నెలలో అందరికీ అందుబాటులోకి వస్తుంది. మరో రెండు నెలల్లో ఏపీఐల సెట్‌నూ విడుదల చేయనున్నారు. ఇది ఏఐ చోదక ఆవిష్కరణలో కొత్త యుగానికి దారితీస్తుందని ఆశిస్తున్నారు.


ఎనలేని భాషిణి కృషి

జాతీయ భాషల అనువాదం కోసం కేంద్ర ప్రభుత్వం చేపట్టిన ‘భాషిణి’ ప్రాజెక్టు ఎనలేని కృషి చేస్తోంది. ఇంటర్నెట్‌, డిజిటల్‌ సేవలను భారతీయ భాషల్లో యాక్సెస్‌ చేయటం కోసమే దీన్ని ఏర్పాటు చేశారు. ప్రధానమంత్రి నరేంద్ర మోదీ ప్రసంగాన్ని అప్పటికప్పుడు హిందీ నుంచి తమిళంలోకి తర్జుమా చేసిందీ, గ్లోబల్‌ ఏఐ కాంక్లేవ్‌ సమావేశంలో అమితాబ్‌ నాగ్‌ హిందీలో మాటలతోనే డబ్బు పంపిణీ చేయటం వెనక ఉన్నదీ భాషిణి రూపొందించిన ఏఐ టూల్సే. భాషిణి అనేది ప్రజా భాషా వేదిక. కృత్రిమ మేధ, ఇతర వినూత్న సాంకేతిక పరిజ్ఞానాల సాయంతో ప్రజలకు ఉపయోగపడే టూల్స్‌, సర్వీసులను అభివృద్ధి చేయటం దీని ఉద్దేశం. నిజానికి వ్యక్తిగతీకరణ అనేది భాషతోనే మొదలవుతుంది. సేవల విషయంలో అన్నింటికన్నా బాగా ఉపయోగపడేది ఇదే. దీన్ని దృష్టిలో పెట్టుకునే భాషిణి వినూత్న ప్రయోగాలకు శ్రీకారం చుట్టింది. ఆటోమేటిక్‌ స్పీచ్‌ రికగ్నిషన్‌, ఆప్టికల్‌ క్యారెక్టర్‌ రికగ్నిషన్‌ (ఓసీఆర్‌), సహజ భాషలను అర్థం చేసుకోవటం, మెషిన్‌ అనువాదం, అక్షరాలను మాటల్లోకి మార్చటం (స్పీచ్‌ టు టెక్స్ట్‌) వంటి ప్రక్రియలు దీనిలోని కీలకాంశాలు. ఉదాహరణకు- ఓసీఆర్‌నే తీసుకోండి. ఇది బ్రోచర్లు, పుస్తకాల వంటి ముద్రిత వనరుల నుంచి టెక్స్ట్‌ను సంగ్రహిస్తుంది. దీంతో 14 భాషల్లో ఏఐ నమూనాలకు శిక్షణ ఇస్తోంది. డిజిటల్‌ వ్యత్యాసాన్ని పూరించటానికి ఇలాంటి పనులన్నీ కీలకం. అయితే స్థానిక డేటాబేస్‌ను సేకరించటమే పెద్ద సవాలు. మనదేశంలో అధికారికంగా గుర్తించిన భాషల్లో కొన్నింటికి డిజిటల్‌ డేటా అందుబాటులోనే లేదు. మరి ఏఐ నమూనాలకు శిక్షణ ఇవ్వటం, నమూనాలను రూపొందించటం ఎలా సాధ్యమవుతుంది? ఇక్కడే భాషిణి సాంకేతిక నిపుణులు కొత్తగా ఆలోచిస్తున్నారు. వివిధ వనరుల నుంచి అక్షరాలు, మాటలతో వివిధ రకాల డేటాను సేకరించి, సిస్టమ్‌కు అందించేందుకు భాషా దాన్‌ కార్యక్రమాన్నీ చేపట్టారు. ఒకరకంగా దీన్ని భాషను దానం చేయటంతో పోల్చుకోవచ్చు. మాట్లాడటం, ఆ మాటలను ధ్రువీకరించటం, రాయటం ద్వారా ఎవరైనా దీనికి స్వచ్ఛందంగా దానం చేయొచ్చు. ఇందులో పాల్గొన్నవారికి ప్రోత్సాహకంగా కాంస్య, వెండి, బంగారు, ప్లాటినం బ్యాడ్జిలనూ ఇస్తున్నారు. ఇంగ్లిష్‌, హిందీ, తెలుగు లేదా మరేదైనా భారతీయ భాషలో ఐదు వాక్యాలను వెబ్‌సైట్‌కు ‘దానం’ చేసి ‘సునో ఇండియా బ్రాంజ్‌ భాషా సమర్థక్‌’ పురస్కారాన్ని పొందొచ్చు. అలాగే ఈ భాషల్లో ఐదు అనువాదాలను అందించి ‘లిఖో ఇండియా బ్రాంజ్‌ భాషా సమర్థక్‌’ గుర్తింపునూ అందుకోవచ్చు. బోలో ఇండియా, దేఖో ఇండియా పురస్కారాలూ ఉన్నాయి. కావాలంటే మీరూ ప్రయత్నించొచ్చు.

సంస్థల సహకారంతోనూ..

ఏఐ నమూనాల రూపకల్పనకు భాషిణి వివిధ పరిశోధన సంస్థలతోనూ జట్టుకట్టింది. భారతీయ అధికార భాషల విషయంలో ఎదురవుతున్న సమస్యలను పరిష్కరించే బాధ్యతను వీటికి అప్పగించింది. మాట్లాడిన భాషను కంప్యూటర్‌ అర్థం చేసుకోగలగటం (ఆటోమేటిక్‌ స్పీచ్‌ రికగ్నిషన్‌), ఒక భాష నుంచి మరో భాషలోకి మెషిన్‌ అనువాదం చేయటం (మెషిన్‌ ట్రాన్స్‌లేషన్‌), అక్షరాలను మాటలుగా మార్చటం (టెక్స్ట్‌ టు స్పీచ్‌) వంటి సమస్యలను అధిగమించటానికి పరిష్కారాలను సూచించటం వీటి పని. ఏదైనా భాషలో అక్షరాలు ఉన్నట్టయితే కంప్యూటర్‌ వాటిని గుర్తించి వాయిస్‌ రూపంలోకి మార్చటం కూడా ఇందులో ఒకటి.

ఎన్నో ఏఐ మోడళ్లు

ప్రస్తుతం భాషిణిలో సుమారు 290 ఏఐ మోడళ్లున్నాయి. మాటల విషయానికి వస్తే ఇవి 12 భారతీయ భాషలను అర్థం చేసుకోగలవు. టెక్స్ట్‌ విషయంలోనైతే మొత్తం 22 భాషలను గుర్తించగలవు. వీటికి ప్రత్యక్ష డేటా సాయంతోనే శిక్షణ ఇస్తున్నారు. రోజుకు సుమారు లక్ష అంశాలను నేర్పిస్తుండటం విశేషం. వీటి ఆధారంగా తదుపరి పనులను అంచనా వేయటం, పరిష్కరించటం అభ్యసిస్తున్నాయి. భాషిణిలో పేర్ల వంటి వాటిని అదే రూపంలో వ్యక్తపరచే (ట్రాన్స్‌లిటరేషన్‌) సేవలూ అందుబాటులో ఉన్నాయి. అంటే వెంకటేశ్‌ అనే పేరును భాషలతో సంబంధం లేకుండా వెంకటేశ్‌గానే గుర్తిస్తుందన్నమాట. ప్రయోగాత్మకంగా మల్టీమోడల్‌ ఏఐ మోడళ్లను వాడుకోవటాన్నీ భాషిణి ఆరంభించింది.

ఇతర సంస్థలూ..

  • మనదేశానికి చెందిన సెంటర్‌ ఫర్‌ డెవలప్‌మెంట్‌ ఆఫ్‌ అడ్వాన్స్‌డ్‌ కంప్యూటింగ్‌ (సీ-డ్యాక్‌) బహుభాషా ఎకోసిస్టమ్‌ను తయారుచేయటానికి మూడు దశాబ్దాలుగా పనిచేస్తోంది.
  • ప్రైవేటు రంగంలో ఏఐ4భారత్‌కు చెందిన నిలేకని సెంటర్‌ను ప్రత్యేకించి చెప్పుకోవచ్చు. నందన్‌ నిలేకని పేరు మీదుగా ఐఐటీ మద్రాస్‌లో గత సంవత్సరం ఆరంభించిన ఇది భారతీయ భాషల కోసం ఓపెన్‌ సోర్స్‌ లాంగ్వేజీని రూపొందిస్తోంది. దీనికి ఎక్‌స్టెప్‌ ఫౌండేషన్‌, మైక్రోసాఫ్ట్‌కు చెందిన రీసెర్చ్‌ ల్యాబ్‌, ఇండియా డెవలప్‌మెంట్‌ సెంటర్‌ కూడా సహకరిస్తున్నాయి.
  •  బెంగళూరులోని ఏఐ అండ్‌ రోబోటిక్స్‌ టెక్నాలజీ పార్క్‌, ఐఐఎస్‌సీ సంస్థలు గూగుల్‌ ఇండియాతో కలిసి ప్రాజెక్ట్‌ వాణి అనే లార్జ్‌ లాంగ్వేజ్‌ మోడల్‌ను తీసుకురావటానికి కృషి చేస్తున్నాయి.
  •  గూగుల్‌ సంస్థ దేశవ్యాప్తంగా జిల్లాల నుంచి మాట నమూనాలను సేకరించటం మీద దృష్టి సారించింది. ప్రస్తుతానికి 10 రాష్ట్రాల్లోని 80 జిల్లాల నుంచి నమూనాలు సేకరిస్తున్నారు. త్వరలో అన్ని జిల్లాలకు దీన్ని విస్తరించనున్నారు. మొత్తం 1.50 లక్షల గంటల మాటలు, భారతీయ పుస్తకాల్లోంచి 10 కోట్ల వాక్యాలను సేకరించటం దీని ఉద్దేశం.  
  •  క్లౌడ్‌ ఆధారిత కమ్యూనికేషన్‌ అంకుర సంస్థ ఓజోంటెల్‌ ఇటీవల ఐఐటీ హైద్రాబాద్‌లోని స్వేచ్ఛ తెలంగాణతో కలిసి తెలుగు కథల సమాచార సేకరణకు శ్రీకారం చుట్టింది. దీని సాయంతో తెలుగు ఎల్‌ఎల్‌ఎంను రూపొందించనుంది. మొత్తం 20 కళాశాలలకు చెందిన సుమారు 8వేల విద్యార్థులు 40వేల పేజీల తెలుగు కంటెంట్‌ను సృష్టించటంలో పాలు పంచుకున్నారు.
  • సర్వమ్‌ ఏఐ సంస్థ ఓపెన్‌హాతీ సిరీస్‌ పేరిట మనదేశం కోసం ప్రత్యేకంగా ఎల్‌ఎల్‌ఎంలను సృష్టిస్తోంది. వివిధ భారతీయ భాషలను సపోర్టు చేసే ఏఐ మోడళ్లకు శిక్షణ ఇవ్వటం, వాయిస్‌ ఆధారిత ఇంటర్ఫేస్‌లను రూపొందించటం దీని ఉద్దేశం.
Tags :

గమనిక: ఈనాడు.నెట్‌లో కనిపించే వ్యాపార ప్రకటనలు వివిధ దేశాల్లోని వ్యాపారస్తులు, సంస్థల నుంచి వస్తాయి. కొన్ని ప్రకటనలు పాఠకుల అభిరుచిననుసరించి కృత్రిమ మేధస్సుతో పంపబడతాయి. పాఠకులు తగిన జాగ్రత్త వహించి, ఉత్పత్తులు లేదా సేవల గురించి సముచిత విచారణ చేసి కొనుగోలు చేయాలి. ఆయా ఉత్పత్తులు / సేవల నాణ్యత లేదా లోపాలకు ఈనాడు యాజమాన్యం బాధ్యత వహించదు. ఈ విషయంలో ఉత్తర ప్రత్యుత్తరాలకి తావు లేదు.

మరిన్ని