మైక్రోసాఫ్ట్ పరిశోధకులు బుధవారం కొత్త ఫౌండేషన్ మోడల్‌ను ప్రకటించారు, అది ఏజెంట్ ఫంక్షన్లను చేయగలదు. మాగ్మా అని పిలువబడే ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (AI) మోడల్ టెక్స్ట్, ఇమేజెస్, వీడియోలు, అలాగే ప్రాదేశిక ఫార్మాట్లలో పెద్ద మొత్తంలో డేటా సెట్లపై ముందే శిక్షణ పొందింది. రెడ్‌మండ్ ఆధారిత టెక్ దిగ్గజం మాగ్మా అనేది విజన్-లాంగ్వేజ్ (విఎల్) మోడళ్ల పొడిగింపు అని మరియు ఇది మల్టీమోడల్ సమాచారాన్ని అర్థం చేసుకోవడమే కాక, వాటిపై కూడా ప్లాన్ చేసి పనిచేయగలదని అన్నారు. AI ఏజెంట్ -యాక్టివేటెడ్ మోడల్‌ను కంప్యూటర్ విజన్, యూజర్ ఇంటర్‌ఫేస్ (UI) నావిగేషన్ మరియు రోబోటిక్ మానిప్యులేషన్‌తో సహా విస్తృత శ్రేణి పనులలో ఉపయోగించవచ్చు.

మైక్రోసాఫ్ట్ మాగ్మా ఫౌండేషన్ మోడల్‌ను ప్రకటించింది

గితుబ్ పోస్ట్‌లో, మైక్రోసాఫ్ట్ పరిశోధకులు కొత్త మాగ్మా ఫౌండేషన్ మోడల్‌ను వివరించారు. ఫౌండేషన్ నమూనాలు విలక్షణమైన పెద్ద భాషా నమూనాలు (LLM), ఇవి మొదటి నుండి నిర్మించబడ్డాయి మరియు ఇతర మోడల్ నుండి స్వేదనం చేయబడవు. వారు తరచూ ఈ సిరీస్‌లోని ఇతర మోడళ్లకు బేస్‌లైన్‌గా మారతారు. AI మోడల్ విస్తృత శ్రేణి డేటాసెట్లలో ముందే శిక్షణ పొందినదనే అర్థంలో మాగ్మా ప్రత్యేకమైనది.

మాగ్మా వెనుక ఉన్న ప్రాథమిక నిర్మాణం లామా 3 AI మోడల్ అని పరిశోధకులు పేర్కొన్నారు. ఏదేమైనా, మాగ్మాకు దృశ్య ప్రాదేశిక ప్రపంచంలో ప్రణాళికలు మరియు పనిచేసే అవకాశం కూడా ఉంది. దీని అర్థం మోడల్ అవుట్‌పుట్‌లను చాట్‌బాట్‌గా ఉత్పత్తి చేయడమే కాకుండా, చర్యలను కూడా చేయగలదు.

ఇది కంప్యూటర్ విజన్ చాట్‌బాట్‌గా ఉపయోగించవచ్చు, ఇది కెమెరా సెన్సార్లతో జత చేసినప్పుడు కనిపించే ప్రపంచం గురించి సమాచారాన్ని అందించగలదు. పరికరం యొక్క వినియోగదారు ఇంటర్‌ఫేస్‌ను నియంత్రించడానికి శిలాద్రవం కూడా ఉపయోగించబడుతుంది. కానీ మరింత ఆసక్తికరంగా ఏజెంట్ ఫంక్షన్లను ఉపయోగించి సంక్లిష్టమైన పనులను పూర్తి చేయడానికి రోబోట్లను నియంత్రించగలదు.

ఈ అవకాశాల వెనుక ఒక ముఖ్యమైన కారణం విభిన్న డేటాసెట్‌తో పాటు రెండు సాంకేతిక భాగాలు-సెట్స్-ఆఫ్ మార్కింగ్ మరియు ట్రాక్-ఆఫ్-మార్కింగ్ అని పరిశోధకులు తెలిపారు. మునుపటిది చిత్రాలు, వీడియోలు మరియు ప్రాదేశిక డేటాలో పాతుకుపోయిన చర్యను ప్రారంభిస్తుంది, ఇమేజ్ స్పేస్‌లో బటన్లు లేదా రోబోట్ ఆయుధాల కోసం సంఖ్యా గుర్తులను అంచనా వేయడానికి మోడల్ అనుమతించడం ద్వారా. తరువాతి మోడల్ యొక్క తాత్కాలిక వీడియో నైనామిక్స్‌ను ఫీడ్ చేస్తుంది మరియు పట్టుకునే ముందు తదుపరి ఫ్రేమ్‌వర్క్‌ను అంచనా వేయడానికి కారణమవుతుంది. ఇది మోడల్ బలమైన ప్రాదేశిక అవగాహనను అభివృద్ధి చేయడానికి అనుమతిస్తుంది.

మైక్రోసాఫ్ట్ పరిశోధకులు అంతర్గత పరీక్ష ఆధారంగా AI మోడల్ యొక్క రిఫరెన్స్ పాయింట్లను కూడా పంచుకున్నారు. ఇది అన్ని ఏజెంట్ మూల్యాంకన పరీక్షలలో పోటీ స్కోర్‌లను సాధించింది మరియు ఓపెనాయ్, అలీబాబా మరియు గూగుల్ యొక్క నమూనాలను అధిగమించింది. ప్రస్తుతానికి కంపెనీ మాగ్మాను పబ్లిక్ డొమైన్‌లో విడుదల చేయలేదు.

మూల లింక్