కొత్త కొత్త టెక్నాలజీలను యూజర్లకు పరిచయం చేసేందుకు దిగ్గజ టెక్ కంపెనీలైన గూగుల్, మైక్రోసాఫ్ట్ పోటీ పడుతున్నాయి. ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (ai) ఆధారిత చాట్ బోట్ చాట్ జీపీటీ (chatgpt)ని మైక్రోసాఫ్ట్ విడుదల చేయగా.. గూగుల్ సైతం బార్డ్ను అందుబాటులోకి తేనున్నట్లు ప్రకటించింది. ఇప్పుడు చాట్జీపీటీకి పోటీగా గూగుల్ ఏఐ ఆధారిత యూనివర్సల్ స్పీచ్ మోడల్ (usm)ను యూజర్లకు అందించనుంది.
ఈ ఏడాది మే నెలలో అమెరికా కాలిఫోర్నియా నగరం మౌంటెన్ వ్యూ వేదికగా జరగబోయే గూగుల్ డెవలపర్ డే (Google I/O-Input/Output)లో కంపెనీ భవిష్యత్ లక్ష్యాలు, యూఎస్ఎం మోడల్పై స్పష్టత ఇవ్వనుంది. దీంతో పాటు గూగుల్ 20 రకాలైన ఏఐ ఆధారిత ప్రొడక్ట్ల గురించి వివరించనున్నట్లు పలు నివేదికలు వెలుగులోకి వచ్చాయి.
గూగుల్ యూనివర్సల్ స్పీచ్ మోడల్ అంటే?
గూగుల్ 2022 నవంబర్లో జరిగిన ఈవెంట్లో ఈ ఏఐ ఆధారిత స్పీచ్ను యూజర్లకు అందిస్తామని తెలపగా.. ఆ ప్రకటనకు కొనసాగింపుగా ప్రపంచంలో అత్యధికంగా మాట్లాడే 1000 భాషలను ఏఐ పద్దతిలో యూజర్లు వినియోగించుకోవచ్చని తాజాగా తెలిపింది. ఇందుకోసం 300 భాషల్లో 2 బిలియన్ పారమీటర్స్లో శిక్షణ ఇచ్చి 12 గంటల మిలియన్ గంటల ప్రసంగం, 28 బిలియన్ సెంటెన్స్ను తయారు చేసినట్లు గూగుల్ పేర్కొంది.
యూనివర్సల్ స్పీచ్ మోడల్తో ఉపయోగాలు
ప్రస్తుతం యూట్యూబ్ యూనివర్సల్ స్పీచ్ మోడల్ను వీడియోల్లో క్లోజ్డ్ క్యాప్షన్ కోసం వినియోగిస్తుంది. వీడియోల్లో క్లోజ్డ్ క్యాప్షన్ అంటే డైలాగ్స్ను టెక్స్ట్ రూపంలో స్క్రీన్ మీద చూపించడం. ఈ టెక్నాలజీ అటోమెటిక్ స్పీచ్ రికగ్నైజేషన్ (ఏఎస్ఆర్) మీద పనిచేస్తుంది. ప్రస్తుతం,యూఎస్ఎం 100కి పైగా భాషలకు సపోర్ట్ చేస్తున్నట్లు టెక్ దిగ్గజం చెప్పింది. మెటా సైతం ఏఐ ఆధారిత లాంగ్వేజ్పై పనిచేస్తుంది. ప్రస్తుతం ఇది ప్రారంభ దశలో ఉంది.
యూనివర్సల్ స్పీచ్ మోడల్ను ఎలా ఉపయోగించుకోవచ్చు
గూగుల్ ఈ సాంకేతికతను ఆగ్మెంటెడ్-రియాలిటీ (AR) గ్లాసెస్లో ఉపయోగించాలని భావిస్తుంది. కంపెనీ తన ఐ/ఓ 2022 ఈవెంట్లో చూపినట్లుగా ఏఆర్ గ్లాసెస్ను ధరిస్తే మనం చూసే ప్రతి దృశ్యాన్ని కావాల్సిన లాంగ్వేజ్లలో ట్రాన్సలేట్ అవుతుంది. ఈ టెక్నాలజీ వినియోగంలోకి రావాలంటే ఇంకా మరింత సమయం పట్టనుంది.
Comments
Please login to add a commentAdd a comment