వాయిస్ రికగ్నిషన్లో మరింత పురోగతి
ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (కృత్రిమ మేథస్సు)లో మైక్రోసాఫ్ట్ పరిశోధకులు గణనీయమైన పురోగతిని సాధించారు. మానవులు ఎలాగైతే భాషను అర్థం చేసుకుంటారో ‘వాయిస్ రికగ్నిషన్ సాఫ్ట్వేర్’ కూడా భాషను అదేస్థాయిలో అర్థం చేసుకునేలా అభివృద్ధి చేయడంలో విజయం సాధించారు. భాషను గుర్తించడంలో మానవుల్లో పొరపాటు శాతం 5.9 శాతం ఉండగా, ఇప్పుడు అదే స్థాయికి గళాన్ని గుర్తించడంలో కంప్యూటర్ సాఫ్ట్వేర్ పొరపాటును పరిమితం చేయగలిగారు.
ఇంతకుముందు ఈ ఎర్రర్ రేటను 6.3 శాతానికి తీసుకరాగలిగామని ఇదే మైక్రోసాఫ్ట్ పరిశోధకుల బృందం ప్రకటించింది. ఇప్పుడు డాన్ని 5.9 శాతానికి తగ్గించగలిగామని మైక్రోసాఫ్ట్ బ్లాగ్లో పేర్కొంది. గతంలో ఈ ఎర్రర్ రేట్ 43 శాతానికి పైగా ఉండేదని పేర్కొంది. మాట్లాడేటప్పుడు మానవ మెదడులో కలిగే మార్పులను దృష్టిలో పెట్టుకొని మరిన్ని గ్రాఫిక్స్ రూపొందించడం ద్వారా ‘వాయిస్ రికగ్నిషన్లో ఎర్రర్ శాతాన్ని తగ్గించగలిగామని ఆ బృందం వెల్లడించింది. ఇందులో ఎర్రర్ శాతాన్ని తగ్గించగలమే గానీ పూర్తిగా నిర్మూలించడం ఎవరివల్లా సాధ్యమయ్యే పనికాదని, ఎందుకంటే ఒకరి ఉచ్ఛారణను మానవులే పొరపాటు పడుతున్నప్పుడు కంప్యూటర్లు పొరపాటు పడడం వింతేమీ కాదని ఆ బృందం వ్యాఖ్యానించింది.
అయితే ఇంకా ఈ విషయంలో ఎంతో పురోగతి సాధించాల్సిన అవసరం ఉందని, ఓ గుంపు ఓ చోట మాట్లాడుతున్నప్పుడు ఆ గుంపులో ఓ వ్యక్తి ఏం మాట్లాడుతున్నాడో లేదా ఓ వ్యక్తి గొంతు వెనక పది గొంతులు కలసి వినిపిస్తున్నప్పుడు ఆ పది గొంతులను తొలగించి ఆ ఒక్క వ్యక్తి గొంతును మాత్రమే స్పష్టంగా గుర్తించేలా ఈ సాఫ్ట్వేర్ను అభివృద్ధి చేయాల్సి ఉందని ఆ బృందం పేర్కొంది. ఓ వ్యక్తి మాట్లాడుతున్నప్పుడు వాళ్లు ఉపయోగించిన పదాల వెనక సందర్భం ఏంటో మానవులు గ్రహించగలరుగానీ కంప్యూటర్ సాఫ్ట్వేర్ గుర్తించే పరిస్థితి ప్రస్తుతానికి లేదు. వచ్చే అవకాశం కూడా లేదు.