భవిష్యత్తంతా కృత్రిమ మేధదే. ఇది అందరూ ముక్తకంఠంతో చెబుతున్న మాట. ఈ నేపథ్యంలో ఆ రంగంపై పట్టు బిగించేందుకు ఐటీ దిగ్గజాలన్నీ శాయశక్తులా ప్రయత్నిస్తున్నాయి. మైక్రోసాఫ్ట్ ఇప్పటికే ఓపెన్ఏఐ యాజమాన్యంలోని చాట్జీపీటీ ప్రాజెక్టులో మెజారిటీ భాగస్వామి కావడం ద్వారా ఈ దిశగా తొలి అడుగు వేసింది.
గడచిన ఏడాది కాలంలో మరెన్నో ఏఐ మోడళ్లు తెరపైకి వచ్చినా ఓపెన్ ఏఐ తాలూకు జీపీటీ మోడళ్లతో పోటీ పడలేకపోతున్నాయి. దానికి పోటీగా జెమినీ పేరుతో గూగుల్ తాజాగా కొత్త ఏఐ మోడల్ను ప్రకటించింది. దీనిపై ఇప్పుడు అంతటా ఆసక్తి నెలకొంది...
మొగ్గు జెమినీకే కనిపిస్తున్నా...
అవడానికి చాట్జీపీటీ, జెమినీ రెండూ జెనరేటివ్ ఏఐ మోడళ్లే. ఇవి ఇన్పుట్ ట్రైనింగ్ డేటా తాలూకు ప్యాట్రన్ల ఆధారంగా పిక్చర్లు, పదాలు, ఇతర మీడియా వంటి కొత్త డేటాను కోరిన విధంగా జెనరేట్ చేస్తాయి. చాట్జీపీటీ ప్రధానంగా లార్జ్ లాంగ్వేజ్ మోడల్ (ఎల్ఎల్ఎం). ఇది టెక్స్ట్ జెనరేట్ చేయడంపై ఎక్కువగా దృష్టి పెడుతుంది. అలాగే జీపీటీ ఆధారిత వెబ్ సంభాషణల యాప్గా కూడా పని చేస్తుంది. గూగుల్కు కూడా బార్డ్ పేరుతో ఇలాంటి యాప్ ఇప్పటికే ఉంది.
ఇది గతంలో లాఎండీఏ లాంగ్వేజ్ మోడ్పై ఆధారపడేది. ఇప్పుడు జెమినీ కోసమని పీఏఎల్ఎం2 మోడ్గా దాన్ని అప్గ్రేడ్ చేస్తోంది గూగుల్. ఇది మల్టీ మోడల్ తరహా మోడల్ కావడమే చాట్జీపీటీతో పాటు ఇతర అన్ని ఏఐల కంటే జెమినీని ఇప్పుడు ప్రత్యేకంగా నిలుపుతోంది. ఎందుకంటే ఇది మలి్టపుల్ ఇన్పుట్, ఔట్పుట్ మోడ్లతో నేరుగా పని చేయగలదు. అంతేగాక టెక్స్ట్, ఆడియో, వీడియోలను కూడా బాగా సపోర్ట్ చేస్తుంది.
ఓపెన్ ఏఐ కూడా ఇలాంటి సామర్థ్యంతో కూడిన జీపీటీ–4 విజన్ మోడల్ను ప్రకటించినా అది జెమినీ మాదిరిగా పూర్తిస్థాయి మలీ్టమోడల్ కాదు. ఎందుకంటే ఇది ప్రధానంగా టెక్స్ట్ పైనే ఆధారపడుతుంది. ఉదాహరణకు ఆడియో ఇన్పుట్స్ను స్పీచ్ ఔట్పుట్గా మార్చేందుకు విష్పర్ అనే స్పీచ్ టు టెక్స్ట్ ఇన్పుట్ లెరి్నంగ్ మోడల్ సాయం తీసుకుంటుంది. ఇమేజీలను అందించాలన్నా అంతే.
అది జెనరేట్ చేసే టెక్స్ట్ ప్రాంప్్టలను డాల్–ఈ2 అనే మరో డీప్ లెరి్నంగ్ మోడల్ ఇమేజీలుగా మారుస్తుంది. కానీ గూగుల్ మాత్రం జెమినీని ఇలా కాకుండా పూర్తిస్థాయి మల్టీ మోడల్ ఏఐగా తీర్చిదిద్దుతోంది. ఇతర లెరి్నంగ్ మోడళ్ల సాయంతో నిమిత్తం లేకుండా నేరుగా ఆడియో, ఇమేజీలు, వీడియో, టెక్స్ట్ వంటి ఇన్పుట్ టైప్లను అది తనంత తానే కావాల్సిన ఔట్పుట్లుగా మార్చేస్తుంది.
జీపీటీ–4తో పోలిస్తే జెమినీ పనితీరు ఎలా ఉంటుందో ఇప్పటికి తెలియకపోయినా దాన్ని చాలా హెచ్చు సామర్థ్యంతో రూపొందిస్తున్నట్టు గూగుల్ ప్రకటించుకుంది. దానికిప్పటికే జెమినీ 1.0 అల్ట్రా అని కూడా పేరు పెట్టింది. ప్రయోగాత్మకంగా చేసిన పరీక్షల్లో ఇది జీపీటీ–4 కంటే మిన్నగా తేలిందని చెబుతోంది కూడా. ఇందుకు రుజువుగా ఓ వీడియో కూడా విడుదల చేసింది. కాకపోతే అందులో చూపించిన టాస్్కలను రియల్టైమ్లో చేయడంలో జెమినీ ఏ మేరకు కృతకృత్యమవుతుందో చూడాల్సి ఉంది.
అంతిమ లబ్ధి యూజర్లకే...
ఈ సందేహాల మాట ఎలా ఉన్నా జెమినీ వంటి భారీ మలీ్టమోడల్ మోడళ్లు జెనరేటివ్ ఏఐ రంగంలో విప్లవాత్మక మార్పులకు శ్రీకారం చుడతాయని ఐటీ రంగ నిపుణులు అంచనా వేస్తున్నారు. ఎందుకంటే ప్రధానంగా టెక్స్ట్ ఆధారితమైన జీపీటీ–4 ఇప్పటికే ఏకంగా 500 బిలియన్ పదాలపై శిక్షణ పొందింది! అంటే, పబ్లిక్ డొమైన్లో అందుబాటులో ఉన్న నాణ్యమైన పదాలన్నీ దానికిప్పటికే చిరపరిచితమని చెప్పవచ్చు.
ఇలాంటి ట్రైనింగ్ డేటాతో పాటు మోడల్ తాలూకు సంక్లిష్టత ఎంత ఎక్కువగా ఉంటే దాని పనితీరు అంత ప్రభావవంతంగా ఉంటుంది. అయితే ఇలాంటి అన్ని రకాల డేటాను నేరుగా వాడగల జెమినీ వంటి ఏఐ మోడళ్లు మున్ముందు మరింత సామర్థ్యం సంతరించుకోవడం ఖాయంగా కని్పస్తోంది. అదే సమయంలో దీనికి పోటీగా ఓపెన్ ఏఐ కూడా అప్గ్రేడెడ్ జీపీటీ–5 వెర్షన్పై ఇప్పటికే ముమ్మరంగా కృషి చేస్తోంది. ఈ నిరంతర పోటీ అంతిమంగా యూజర్లకే మరింత లబ్ధి చేకూరుస్తుందని ఐటీ రంగ నిపుణులు చెబుతున్నారు.
– సాక్షి, నేషనల్ డెస్క్
Comments
Please login to add a commentAdd a comment