మైక్రోసాఫ్ట్ పరిశోధకులు బుధవారం కొత్త ఫౌండేషన్ మోడల్ను ప్రకటించారు, అది ఏజెంట్ ఫంక్షన్లను చేయగలదు. మాగ్మా అని పిలువబడే ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (AI) మోడల్ టెక్స్ట్, ఇమేజెస్, వీడియోలు, అలాగే ప్రాదేశిక ఫార్మాట్లలో పెద్ద మొత్తంలో డేటా సెట్లపై ముందే శిక్షణ పొందింది. రెడ్మండ్ ఆధారిత టెక్ దిగ్గజం మాగ్మా అనేది విజన్-లాంగ్వేజ్ (విఎల్) మోడళ్ల పొడిగింపు అని మరియు ఇది మల్టీమోడల్ సమాచారాన్ని అర్థం చేసుకోవడమే కాక, వాటిపై కూడా ప్లాన్ చేసి పనిచేయగలదని అన్నారు. AI ఏజెంట్ -యాక్టివేటెడ్ మోడల్ను కంప్యూటర్ విజన్, యూజర్ ఇంటర్ఫేస్ (UI) నావిగేషన్ మరియు రోబోటిక్ మానిప్యులేషన్తో సహా విస్తృత శ్రేణి పనులలో ఉపయోగించవచ్చు.
మైక్రోసాఫ్ట్ మాగ్మా ఫౌండేషన్ మోడల్ను ప్రకటించింది
గితుబ్ పోస్ట్లో, మైక్రోసాఫ్ట్ పరిశోధకులు కొత్త మాగ్మా ఫౌండేషన్ మోడల్ను వివరించారు. ఫౌండేషన్ నమూనాలు విలక్షణమైన పెద్ద భాషా నమూనాలు (LLM), ఇవి మొదటి నుండి నిర్మించబడ్డాయి మరియు ఇతర మోడల్ నుండి స్వేదనం చేయబడవు. వారు తరచూ ఈ సిరీస్లోని ఇతర మోడళ్లకు బేస్లైన్గా మారతారు. AI మోడల్ విస్తృత శ్రేణి డేటాసెట్లలో ముందే శిక్షణ పొందినదనే అర్థంలో మాగ్మా ప్రత్యేకమైనది.
మాగ్మా వెనుక ఉన్న ప్రాథమిక నిర్మాణం లామా 3 AI మోడల్ అని పరిశోధకులు పేర్కొన్నారు. ఏదేమైనా, మాగ్మాకు దృశ్య ప్రాదేశిక ప్రపంచంలో ప్రణాళికలు మరియు పనిచేసే అవకాశం కూడా ఉంది. దీని అర్థం మోడల్ అవుట్పుట్లను చాట్బాట్గా ఉత్పత్తి చేయడమే కాకుండా, చర్యలను కూడా చేయగలదు.
ఇది కంప్యూటర్ విజన్ చాట్బాట్గా ఉపయోగించవచ్చు, ఇది కెమెరా సెన్సార్లతో జత చేసినప్పుడు కనిపించే ప్రపంచం గురించి సమాచారాన్ని అందించగలదు. పరికరం యొక్క వినియోగదారు ఇంటర్ఫేస్ను నియంత్రించడానికి శిలాద్రవం కూడా ఉపయోగించబడుతుంది. కానీ మరింత ఆసక్తికరంగా ఏజెంట్ ఫంక్షన్లను ఉపయోగించి సంక్లిష్టమైన పనులను పూర్తి చేయడానికి రోబోట్లను నియంత్రించగలదు.
ఈ అవకాశాల వెనుక ఒక ముఖ్యమైన కారణం విభిన్న డేటాసెట్తో పాటు రెండు సాంకేతిక భాగాలు-సెట్స్-ఆఫ్ మార్కింగ్ మరియు ట్రాక్-ఆఫ్-మార్కింగ్ అని పరిశోధకులు తెలిపారు. మునుపటిది చిత్రాలు, వీడియోలు మరియు ప్రాదేశిక డేటాలో పాతుకుపోయిన చర్యను ప్రారంభిస్తుంది, ఇమేజ్ స్పేస్లో బటన్లు లేదా రోబోట్ ఆయుధాల కోసం సంఖ్యా గుర్తులను అంచనా వేయడానికి మోడల్ అనుమతించడం ద్వారా. తరువాతి మోడల్ యొక్క తాత్కాలిక వీడియో నైనామిక్స్ను ఫీడ్ చేస్తుంది మరియు పట్టుకునే ముందు తదుపరి ఫ్రేమ్వర్క్ను అంచనా వేయడానికి కారణమవుతుంది. ఇది మోడల్ బలమైన ప్రాదేశిక అవగాహనను అభివృద్ధి చేయడానికి అనుమతిస్తుంది.
మైక్రోసాఫ్ట్ పరిశోధకులు అంతర్గత పరీక్ష ఆధారంగా AI మోడల్ యొక్క రిఫరెన్స్ పాయింట్లను కూడా పంచుకున్నారు. ఇది అన్ని ఏజెంట్ మూల్యాంకన పరీక్షలలో పోటీ స్కోర్లను సాధించింది మరియు ఓపెనాయ్, అలీబాబా మరియు గూగుల్ యొక్క నమూనాలను అధిగమించింది. ప్రస్తుతానికి కంపెనీ మాగ్మాను పబ్లిక్ డొమైన్లో విడుదల చేయలేదు.