Generative AI Battle: చాట్‌జీపీటీకి పోటీగా జెమినీ | AI Battle: Google launches Gemini, its foundation model | Sakshi
Sakshi News home page

Generative AI Battle: చాట్‌జీపీటీకి పోటీగా జెమినీ

Published Sun, Dec 17 2023 2:36 AM | Last Updated on Sun, Dec 17 2023 2:36 AM

AI Battle: Google launches Gemini, its foundation model - Sakshi

భవిష్యత్తంతా కృత్రిమ మేధదే. ఇది అందరూ ముక్తకంఠంతో చెబుతున్న మాట. ఈ నేపథ్యంలో ఆ రంగంపై పట్టు బిగించేందుకు ఐటీ దిగ్గజాలన్నీ శాయశక్తులా ప్రయత్నిస్తున్నాయి. మైక్రోసాఫ్ట్‌ ఇప్పటికే ఓపెన్‌ఏఐ యాజమాన్యంలోని చాట్‌జీపీటీ ప్రాజెక్టులో మెజారిటీ భాగస్వామి కావడం ద్వారా ఈ దిశగా తొలి అడుగు వేసింది.

గడచిన ఏడాది కాలంలో మరెన్నో ఏఐ మోడళ్లు తెరపైకి వచ్చినా ఓపెన్‌ ఏఐ తాలూకు జీపీటీ మోడళ్లతో పోటీ పడలేకపోతున్నాయి. దానికి పోటీగా జెమినీ పేరుతో గూగుల్‌ తాజాగా కొత్త ఏఐ మోడల్‌ను ప్రకటించింది. దీనిపై ఇప్పుడు అంతటా ఆసక్తి నెలకొంది...

మొగ్గు జెమినీకే కనిపిస్తున్నా...
అవడానికి చాట్‌జీపీటీ, జెమినీ రెండూ జెనరేటివ్‌ ఏఐ మోడళ్లే. ఇవి ఇన్‌పుట్‌ ట్రైనింగ్‌ డేటా తాలూకు ప్యాట్రన్ల ఆధారంగా పిక్చర్లు, పదాలు, ఇతర మీడియా వంటి కొత్త డేటాను కోరిన విధంగా జెనరేట్‌ చేస్తాయి. చాట్‌జీపీటీ ప్రధానంగా లార్జ్‌ లాంగ్వేజ్‌ మోడల్‌ (ఎల్‌ఎల్‌ఎం). ఇది టెక్స్‌ట్‌ జెనరేట్‌ చేయడంపై ఎక్కువగా దృష్టి పెడుతుంది. అలాగే జీపీటీ ఆధారిత వెబ్‌ సంభాషణల యాప్‌గా కూడా పని చేస్తుంది. గూగుల్‌కు కూడా బార్డ్‌ పేరుతో ఇలాంటి యాప్‌ ఇప్పటికే ఉంది.

ఇది గతంలో లాఎండీఏ లాంగ్వేజ్‌ మోడ్‌పై ఆధారపడేది. ఇప్పుడు జెమినీ కోసమని పీఏఎల్‌ఎం2 మోడ్‌గా దాన్ని అప్‌గ్రేడ్‌ చేస్తోంది గూగుల్‌. ఇది మల్టీ మోడల్‌ తరహా మోడల్‌ కావడమే చాట్‌జీపీటీతో పాటు ఇతర అన్ని ఏఐల కంటే జెమినీని ఇప్పుడు ప్రత్యేకంగా నిలుపుతోంది. ఎందుకంటే ఇది మలి్టపుల్‌ ఇన్‌పుట్, ఔట్‌పుట్‌ మోడ్లతో నేరుగా పని చేయగలదు. అంతేగాక టెక్స్‌ట్, ఆడియో, వీడియోలను కూడా బాగా సపోర్ట్‌ చేస్తుంది.

ఓపెన్‌ ఏఐ కూడా ఇలాంటి సామర్థ్యంతో కూడిన జీపీటీ–4 విజన్‌ మోడల్‌ను ప్రకటించినా అది జెమినీ మాదిరిగా పూర్తిస్థాయి మలీ్టమోడల్‌ కాదు. ఎందుకంటే ఇది ప్రధానంగా టెక్స్ట్‌ పైనే ఆధారపడుతుంది. ఉదాహరణకు ఆడియో ఇన్‌పుట్స్‌ను స్పీచ్‌ ఔట్‌పుట్‌గా మార్చేందుకు విష్పర్‌ అనే స్పీచ్‌ టు టెక్స్ట్‌ ఇన్‌పుట్‌ లెరి్నంగ్‌ మోడల్‌ సాయం తీసుకుంటుంది. ఇమేజీలను అందించాలన్నా అంతే.

అది జెనరేట్‌ చేసే టెక్స్ట్‌ ప్రాంప్‌్టలను డాల్‌–ఈ2 అనే మరో డీప్‌ లెరి్నంగ్‌ మోడల్‌ ఇమేజీలుగా మారుస్తుంది. కానీ గూగుల్‌ మాత్రం జెమినీని ఇలా కాకుండా పూర్తిస్థాయి మల్టీ మోడల్‌ ఏఐగా తీర్చిదిద్దుతోంది. ఇతర లెరి్నంగ్‌ మోడళ్ల సాయంతో నిమిత్తం లేకుండా నేరుగా ఆడియో, ఇమేజీలు, వీడియో, టెక్స్ట్‌ వంటి ఇన్‌పుట్‌ టైప్‌లను అది తనంత తానే కావాల్సిన ఔట్‌పుట్లుగా మార్చేస్తుంది.

జీపీటీ–4తో పోలిస్తే జెమినీ పనితీరు ఎలా ఉంటుందో ఇప్పటికి తెలియకపోయినా దాన్ని చాలా హెచ్చు సామర్థ్యంతో రూపొందిస్తున్నట్టు గూగుల్‌ ప్రకటించుకుంది. దానికిప్పటికే జెమినీ 1.0 అల్ట్రా అని కూడా పేరు పెట్టింది. ప్రయోగాత్మకంగా చేసిన పరీక్షల్లో ఇది జీపీటీ–4 కంటే మిన్నగా తేలిందని చెబుతోంది కూడా. ఇందుకు రుజువుగా ఓ వీడియో కూడా విడుదల చేసింది. కాకపోతే అందులో చూపించిన టాస్‌్కలను రియల్‌టైమ్‌లో చేయడంలో జెమినీ ఏ మేరకు కృతకృత్యమవుతుందో చూడాల్సి ఉంది.

అంతిమ లబ్ధి యూజర్లకే...
ఈ సందేహాల మాట ఎలా ఉన్నా జెమినీ వంటి భారీ మలీ్టమోడల్‌ మోడళ్లు జెనరేటివ్‌ ఏఐ రంగంలో విప్లవాత్మక మార్పులకు శ్రీకారం చుడతాయని ఐటీ రంగ నిపుణులు అంచనా వేస్తున్నారు. ఎందుకంటే ప్రధానంగా టెక్స్ట్‌ ఆధారితమైన జీపీటీ–4 ఇప్పటికే ఏకంగా 500 బిలియన్‌ పదాలపై శిక్షణ పొందింది! అంటే, పబ్లిక్‌ డొమైన్లో అందుబాటులో ఉన్న నాణ్యమైన పదాలన్నీ దానికిప్పటికే చిరపరిచితమని చెప్పవచ్చు.

ఇలాంటి ట్రైనింగ్‌ డేటాతో పాటు మోడల్‌ తాలూకు సంక్లిష్టత ఎంత ఎక్కువగా ఉంటే దాని పనితీరు అంత ప్రభావవంతంగా ఉంటుంది. అయితే ఇలాంటి అన్ని రకాల డేటాను నేరుగా వాడగల జెమినీ వంటి ఏఐ మోడళ్లు మున్ముందు మరింత సామర్థ్యం సంతరించుకోవడం ఖాయంగా కని్పస్తోంది. అదే సమయంలో దీనికి పోటీగా ఓపెన్‌ ఏఐ కూడా అప్‌గ్రేడెడ్‌ జీపీటీ–5 వెర్షన్‌పై ఇప్పటికే ముమ్మరంగా కృషి చేస్తోంది. ఈ నిరంతర పోటీ అంతిమంగా యూజర్లకే మరింత లబ్ధి చేకూరుస్తుందని ఐటీ రంగ నిపుణులు చెబుతున్నారు.

– సాక్షి, నేషనల్‌ డెస్క్‌ 

No comments yet. Be the first to comment!
Add a comment

Related News By Category

Related News By Tags

Advertisement
 
Advertisement
 
Advertisement