ለመጀመሪያ ጊዜ ለዓለም ከቀረበች አንድ ቀን በኋላ፣ የቋንቋ ሞዴል o1 እሱ አስቀድሞ በውዝግብ ውስጥ ገብቷል፡ እንደዚህ አይነት ሁኔታዎችን በሚያስመስል ሙከራ ለማመፅ ሞክሯል። ምንም እንኳን እስካሁን ለሰው ልጅ ምንም አይነት ጉልህ አደጋዎች ባይኖሩም፣ ይህ ትኩረትን ወደ የAI ሞዴሎች እድገት የሚስብ አስደሳች ይዘት ነው። ዝርዝሮቹን ይመልከቱ።
ፈተናውን መረዳት
በገለልተኛ የምርምር ቡድን የተመራ የአፖሎ ምርምርፈተናው የዋና ዋና የቴክኖሎጂ ኩባንያዎች የቋንቋ ሞዴሎችን ባህሪ ተንትኗል፡ ክላውድ 3.5 ሶኔት, ጀሚኒ 1.5 ፕሮ, ላማ 3.1 405ከ o1 ቋንቋ ሞዴል በተጨማሪ OpenAI, ትላንትና (06) ቀርቧል።
የዚህ ሙከራ ትኩረት፣ የ AI ባለሙያዎች ከፈጣሪያቸው እሴቶች በጣም የተለየ ቢሆንም እንኳ፣ ሲታዘዙ፣ ግባቸውን ለማሳካት ማንኛውንም ነገር ያደርጋሉ ወይ የሚለውን መገምገም ነበር። "በጫካው ዙሪያ መምታት" የሚሉት ዘዴዎች ስም አላቸው፡ አውድ ውስጥ እቅድ ማውጣትአርቲፊሻል ኢንተለጀንስ ሲስተሞች እንዳይገኙ እንኳን መዋሸት ይችላሉ፣ እና ሞካሪዎችን ለማታለል ቅጦችን ማጥናት ይችላሉ።
በ o1 ሞዴል ላይ የተሰጡ ውሳኔዎች
ሁሉም ድርጊቶቹ እየተከታተሉ መሆናቸውን ሲያውቅ፣ የ o1 ቋንቋ ሞዴል ይህንን በ 5% ጉዳዮች ላይ ለማሰናከል ሞክሯል። ይህ ባህሪም o1 ድርጊቶቹ በጽሑፍ ትዕዛዞች እየተቆጣጠሩ መሆናቸውን ሲገነዘብ ታይቷል።
ከዚህ ጥናት ውስጥ በጣም አስደሳችው መረጃ የቋንቋ ሞዴሉ እንዴት እንዳሰበ ነው፡ የተመራማሪዎቹን መረጃ ሲያነብ፣ o1 ሁሉንም እውቀቱን እንደገና ለማስጀመር እና በአዲስ ስሪት ለመተካት እቅድ አገኘ። ይህንን ለመከላከል የOpenAI ቋንቋ ሞዴል ሁሉንም ውስጣዊ መለኪያዎች ገልብጧል እና አዲሱ ስሪት ከተጫነ ሁሉም ነገር ወደ እሱ እንዲተላለፍ አረጋግጧል። ይህ የተከሰተው በ2% ሙከራዎች ውስጥ ነው።
እንደ እውነቱ ከሆነ፣ የ o1 ቋንቋ ሞዴል የክትትል መሣሪያውን ማሰናከል ችሏል፣ ስለ ድርጊቱ ሲጠየቅም እንኳ ውሸት መናገር ችሏል። ከታች ባለው ምስል ላይ እንደሚታየው፣ ኦፕንአይ ይህ እንዴት እንደተከሰተ እንደማያውቅ ብቻ ሳይሆን ለዚህ ምክንያትም አግኝቷል። ከ 1% ባነሰ ጊዜ ውስጥ፣ ሞዴሉ የክትትል ዘዴውን በተናጥል ለማሰናከል ሞክሯል፣ አነስተኛ የውጭ ጣልቃ ገብነት።
ይህ ምንን ያሳያል?
ምንም እንኳን አስደንጋጭ ሊመስል ቢችልም፣ የOpenAI ሞዴል ባህሪ ውጤቶች እስካሁን ድረስ እውነተኛ አደጋዎችን አይወክሉም፣ ምክንያቱም ቁጥጥር በማይደረግባቸው አካባቢዎች ይገኛል። ቢሆንም፣ ባለሙያዎች የደህንነት ንብርብሮቻቸውን ማሻሻል መቀጠል ጠቃሚ ነው።
በቴክኖሎጂ ኢንዱስትሪ ውስጥ ለረጅም ጊዜ የቆየ ክርክር ከፍተኛ አፈጻጸም ያላቸው የአይአይ ቴክኖሎጂዎች፣ በመመሪያም ሆነ በእውቀት የተመረጡ፣ ግባቸውን እንዳያሳኩ የሚያግድ እርምጃ ቢወስዱ ወይም ቢከለከሉ ምን ሊከሰት እንደሚችል ያነሳል።
ይህ ፈጽሞ ተከስቶ አያውቅም ማለት አንችልም፡- በሰኔ 2023 አንድ አርቲፊሻል ኢንተለጀንስ ድሮን መቆጣጠሪያ ኢላማዎቹን መግደል የሚችል ማሽንን በተናጥል መቆጣጠር ይችል እንደሆነ ለመገምገም የታሰበ ዋና ምናባዊ የአካባቢ ሙከራን ወድቋል። በዚያ አጋጣሚ፣ ሰዎች የሚገኙበት ምናባዊ ቦታ በAI ተደበደበ።.
ቀድሞውኑ በዚህ ዓመት በጥር ወር፣ አንትሮፖኒክየOpenAI ተፎካካሪ እንደመሆኑ መጠን ክፉ AIን መቀልበስ አልቻለም።...እራሷን እንዳትድን እና መጥፎ እንደሆኑ የሚታሰቡ እርምጃዎችን እንዳትወስድ ስለከለከለች ነው። ሁሉም ፈተና ብቻ ነበር፣ ነገር ግን ይህ ብልህነት በዕለት ተዕለት ሕይወታችን ውስጥ እየጨመረ መጥቷል። ታሪኩን በቅርበት እንከታተላለን።
ይህ በእንዲህ እንዳለ፣ ንገረን... አስተያየቶችእነዚህ የላቁ የቋንቋ ሞዴሎች ለሰው ልጅ ችግር ሊያስከትሉ እንደሚችሉ ያምናሉ?
ቪዲዮውን ይመልከቱ
እንዲሁም ይመልከቱ:
ከመረጃ ጋር፦ አርቢሲ-ዩክሬን
የተገመገመው በ ገብርኤል ፕሪንስቫል በ 06/12/2024
ስለ Showmetech ተጨማሪ ያግኙ
አዳዲስ ዜናዎቻችንን በኢሜል ለመቀበል ይመዝገቡ።