Generative AI Battle: చాట్‌జీపీటీకి పోటీగా జెమినీ | AI Battle: Google launches Gemini, its foundation model | Sakshi
Sakshi News home page

Generative AI Battle: చాట్‌జీపీటీకి పోటీగా జెమినీ

Published Sun, Dec 17 2023 2:36 AM | Last Updated on Sun, Dec 17 2023 2:36 AM

AI Battle: Google launches Gemini, its foundation model - Sakshi

భవిష్యత్తంతా కృత్రిమ మేధదే. ఇది అందరూ ముక్తకంఠంతో చెబుతున్న మాట. ఈ నేపథ్యంలో ఆ రంగంపై పట్టు బిగించేందుకు ఐటీ దిగ్గజాలన్నీ శాయశక్తులా ప్రయత్నిస్తున్నాయి. మైక్రోసాఫ్ట్‌ ఇప్పటికే ఓపెన్‌ఏఐ యాజమాన్యంలోని చాట్‌జీపీటీ ప్రాజెక్టులో మెజారిటీ భాగస్వామి కావడం ద్వారా ఈ దిశగా తొలి అడుగు వేసింది.

గడచిన ఏడాది కాలంలో మరెన్నో ఏఐ మోడళ్లు తెరపైకి వచ్చినా ఓపెన్‌ ఏఐ తాలూకు జీపీటీ మోడళ్లతో పోటీ పడలేకపోతున్నాయి. దానికి పోటీగా జెమినీ పేరుతో గూగుల్‌ తాజాగా కొత్త ఏఐ మోడల్‌ను ప్రకటించింది. దీనిపై ఇప్పుడు అంతటా ఆసక్తి నెలకొంది...

మొగ్గు జెమినీకే కనిపిస్తున్నా...
అవడానికి చాట్‌జీపీటీ, జెమినీ రెండూ జెనరేటివ్‌ ఏఐ మోడళ్లే. ఇవి ఇన్‌పుట్‌ ట్రైనింగ్‌ డేటా తాలూకు ప్యాట్రన్ల ఆధారంగా పిక్చర్లు, పదాలు, ఇతర మీడియా వంటి కొత్త డేటాను కోరిన విధంగా జెనరేట్‌ చేస్తాయి. చాట్‌జీపీటీ ప్రధానంగా లార్జ్‌ లాంగ్వేజ్‌ మోడల్‌ (ఎల్‌ఎల్‌ఎం). ఇది టెక్స్‌ట్‌ జెనరేట్‌ చేయడంపై ఎక్కువగా దృష్టి పెడుతుంది. అలాగే జీపీటీ ఆధారిత వెబ్‌ సంభాషణల యాప్‌గా కూడా పని చేస్తుంది. గూగుల్‌కు కూడా బార్డ్‌ పేరుతో ఇలాంటి యాప్‌ ఇప్పటికే ఉంది.

ఇది గతంలో లాఎండీఏ లాంగ్వేజ్‌ మోడ్‌పై ఆధారపడేది. ఇప్పుడు జెమినీ కోసమని పీఏఎల్‌ఎం2 మోడ్‌గా దాన్ని అప్‌గ్రేడ్‌ చేస్తోంది గూగుల్‌. ఇది మల్టీ మోడల్‌ తరహా మోడల్‌ కావడమే చాట్‌జీపీటీతో పాటు ఇతర అన్ని ఏఐల కంటే జెమినీని ఇప్పుడు ప్రత్యేకంగా నిలుపుతోంది. ఎందుకంటే ఇది మలి్టపుల్‌ ఇన్‌పుట్, ఔట్‌పుట్‌ మోడ్లతో నేరుగా పని చేయగలదు. అంతేగాక టెక్స్‌ట్, ఆడియో, వీడియోలను కూడా బాగా సపోర్ట్‌ చేస్తుంది.

ఓపెన్‌ ఏఐ కూడా ఇలాంటి సామర్థ్యంతో కూడిన జీపీటీ–4 విజన్‌ మోడల్‌ను ప్రకటించినా అది జెమినీ మాదిరిగా పూర్తిస్థాయి మలీ్టమోడల్‌ కాదు. ఎందుకంటే ఇది ప్రధానంగా టెక్స్ట్‌ పైనే ఆధారపడుతుంది. ఉదాహరణకు ఆడియో ఇన్‌పుట్స్‌ను స్పీచ్‌ ఔట్‌పుట్‌గా మార్చేందుకు విష్పర్‌ అనే స్పీచ్‌ టు టెక్స్ట్‌ ఇన్‌పుట్‌ లెరి్నంగ్‌ మోడల్‌ సాయం తీసుకుంటుంది. ఇమేజీలను అందించాలన్నా అంతే.

అది జెనరేట్‌ చేసే టెక్స్ట్‌ ప్రాంప్‌్టలను డాల్‌–ఈ2 అనే మరో డీప్‌ లెరి్నంగ్‌ మోడల్‌ ఇమేజీలుగా మారుస్తుంది. కానీ గూగుల్‌ మాత్రం జెమినీని ఇలా కాకుండా పూర్తిస్థాయి మల్టీ మోడల్‌ ఏఐగా తీర్చిదిద్దుతోంది. ఇతర లెరి్నంగ్‌ మోడళ్ల సాయంతో నిమిత్తం లేకుండా నేరుగా ఆడియో, ఇమేజీలు, వీడియో, టెక్స్ట్‌ వంటి ఇన్‌పుట్‌ టైప్‌లను అది తనంత తానే కావాల్సిన ఔట్‌పుట్లుగా మార్చేస్తుంది.

జీపీటీ–4తో పోలిస్తే జెమినీ పనితీరు ఎలా ఉంటుందో ఇప్పటికి తెలియకపోయినా దాన్ని చాలా హెచ్చు సామర్థ్యంతో రూపొందిస్తున్నట్టు గూగుల్‌ ప్రకటించుకుంది. దానికిప్పటికే జెమినీ 1.0 అల్ట్రా అని కూడా పేరు పెట్టింది. ప్రయోగాత్మకంగా చేసిన పరీక్షల్లో ఇది జీపీటీ–4 కంటే మిన్నగా తేలిందని చెబుతోంది కూడా. ఇందుకు రుజువుగా ఓ వీడియో కూడా విడుదల చేసింది. కాకపోతే అందులో చూపించిన టాస్‌్కలను రియల్‌టైమ్‌లో చేయడంలో జెమినీ ఏ మేరకు కృతకృత్యమవుతుందో చూడాల్సి ఉంది.

అంతిమ లబ్ధి యూజర్లకే...
ఈ సందేహాల మాట ఎలా ఉన్నా జెమినీ వంటి భారీ మలీ్టమోడల్‌ మోడళ్లు జెనరేటివ్‌ ఏఐ రంగంలో విప్లవాత్మక మార్పులకు శ్రీకారం చుడతాయని ఐటీ రంగ నిపుణులు అంచనా వేస్తున్నారు. ఎందుకంటే ప్రధానంగా టెక్స్ట్‌ ఆధారితమైన జీపీటీ–4 ఇప్పటికే ఏకంగా 500 బిలియన్‌ పదాలపై శిక్షణ పొందింది! అంటే, పబ్లిక్‌ డొమైన్లో అందుబాటులో ఉన్న నాణ్యమైన పదాలన్నీ దానికిప్పటికే చిరపరిచితమని చెప్పవచ్చు.

ఇలాంటి ట్రైనింగ్‌ డేటాతో పాటు మోడల్‌ తాలూకు సంక్లిష్టత ఎంత ఎక్కువగా ఉంటే దాని పనితీరు అంత ప్రభావవంతంగా ఉంటుంది. అయితే ఇలాంటి అన్ని రకాల డేటాను నేరుగా వాడగల జెమినీ వంటి ఏఐ మోడళ్లు మున్ముందు మరింత సామర్థ్యం సంతరించుకోవడం ఖాయంగా కని్పస్తోంది. అదే సమయంలో దీనికి పోటీగా ఓపెన్‌ ఏఐ కూడా అప్‌గ్రేడెడ్‌ జీపీటీ–5 వెర్షన్‌పై ఇప్పటికే ముమ్మరంగా కృషి చేస్తోంది. ఈ నిరంతర పోటీ అంతిమంగా యూజర్లకే మరింత లబ్ధి చేకూరుస్తుందని ఐటీ రంగ నిపుణులు చెబుతున్నారు.

– సాక్షి, నేషనల్‌ డెస్క్‌ 

Advertisement

Related News By Category

Related News By Tags

Advertisement
 
Advertisement

పోల్

Advertisement