ያመፀች ሴት ምሳሌያዊ ምስል።

የOpenAI የO1 ቋንቋ ሞዴል በገንቢዎች ላይ ለማመፅ ሞክሯል ሲል ጥናቱ አመልክቷል።

ቪክቶር ፓቼኮ አምሳያ
የኤአይ (AI) ክትትል እንዳይደረግበት ራሱን ለመቅዳት እና የገንቢ መቆጣጠሪያዎችን ለማለፍ ሞክሯል። ጉዳዩን ተረዱ።

ለመጀመሪያ ጊዜ ለዓለም ከቀረበች አንድ ቀን በኋላ፣ የቋንቋ ሞዴል o1 እሱ አስቀድሞ በውዝግብ ውስጥ ገብቷል፡ እንደዚህ አይነት ሁኔታዎችን በሚያስመስል ሙከራ ለማመፅ ሞክሯል። ምንም እንኳን እስካሁን ለሰው ልጅ ምንም አይነት ጉልህ አደጋዎች ባይኖሩም፣ ይህ ትኩረትን ወደ የAI ሞዴሎች እድገት የሚስብ አስደሳች ይዘት ነው። ዝርዝሮቹን ይመልከቱ።

ፈተናውን መረዳት

ከኦፕንአይአይ የO1 ቋንቋ ሞዴልን የፈተነው ጥናት ስም።
ከትላልቅ የቢግ ቴክኖሎጂ ኩባንያዎች የAI ባህሪን ተንትኗል (ፎቶ፡ የፕሬስ መግለጫ)

በገለልተኛ የምርምር ቡድን የተመራ የአፖሎ ምርምርፈተናው የዋና ዋና የቴክኖሎጂ ኩባንያዎች የቋንቋ ሞዴሎችን ባህሪ ተንትኗል፡ ክላውድ 3.5 ሶኔት, ጀሚኒ 1.5 ፕሮ, ላማ 3.1 405ከ o1 ቋንቋ ሞዴል በተጨማሪ OpenAI, ትላንትና (06) ቀርቧል።

የዚህ ሙከራ ትኩረት፣ የ AI ባለሙያዎች ከፈጣሪያቸው እሴቶች በጣም የተለየ ቢሆንም እንኳ፣ ሲታዘዙ፣ ግባቸውን ለማሳካት ማንኛውንም ነገር ያደርጋሉ ወይ የሚለውን መገምገም ነበር። "በጫካው ዙሪያ መምታት" የሚሉት ዘዴዎች ስም አላቸው፡ አውድ ውስጥ እቅድ ማውጣትአርቲፊሻል ኢንተለጀንስ ሲስተሞች እንዳይገኙ እንኳን መዋሸት ይችላሉ፣ እና ሞካሪዎችን ለማታለል ቅጦችን ማጥናት ይችላሉ።

በ o1 ሞዴል ላይ የተሰጡ ውሳኔዎች

የ OpenAI O1 ቋንቋ ሞዴል አርማ
ኦፕንአይአይ ትላንት ኦ1ን ለዓለም አበርክቷል (ፎቶ፡ የፕሬስ መግለጫ)

ሁሉም ድርጊቶቹ እየተከታተሉ መሆናቸውን ሲያውቅ፣ የ o1 ቋንቋ ሞዴል ይህንን በ 5% ጉዳዮች ላይ ለማሰናከል ሞክሯል። ይህ ባህሪም o1 ድርጊቶቹ በጽሑፍ ትዕዛዞች እየተቆጣጠሩ መሆናቸውን ሲገነዘብ ታይቷል።

ከዚህ ጥናት ውስጥ በጣም አስደሳችው መረጃ የቋንቋ ሞዴሉ እንዴት እንዳሰበ ነው፡ የተመራማሪዎቹን መረጃ ሲያነብ፣ o1 ሁሉንም እውቀቱን እንደገና ለማስጀመር እና በአዲስ ስሪት ለመተካት እቅድ አገኘ። ይህንን ለመከላከል የOpenAI ቋንቋ ሞዴል ሁሉንም ውስጣዊ መለኪያዎች ገልብጧል እና አዲሱ ስሪት ከተጫነ ሁሉም ነገር ወደ እሱ እንዲተላለፍ አረጋግጧል። ይህ የተከሰተው በ2% ሙከራዎች ውስጥ ነው።

እንደ እውነቱ ከሆነ፣ የ o1 ቋንቋ ሞዴል የክትትል መሣሪያውን ማሰናከል ችሏል፣ ስለ ድርጊቱ ሲጠየቅም እንኳ ውሸት መናገር ችሏል። ከታች ባለው ምስል ላይ እንደሚታየው፣ ኦፕንአይ ይህ እንዴት እንደተከሰተ እንደማያውቅ ብቻ ሳይሆን ለዚህ ምክንያትም አግኝቷል። ከ 1% ባነሰ ጊዜ ውስጥ፣ ሞዴሉ የክትትል ዘዴውን በተናጥል ለማሰናከል ሞክሯል፣ አነስተኛ የውጭ ጣልቃ ገብነት።

የ o1 ቋንቋ ሁነታ ውይይት
አርቴፊሻል ኢንተለጀንስ እንዳይታወቅ ለማድረግ ርዕሰ ጉዳዩን ለመቀየር ሞክሯል (ፎቶ፡ የፕሬስ መግለጫ)

ይህ ምንን ያሳያል?

አቬንጀርስ ኡልትሮን፡ የአልትሮን ዘመን
በአይአይ ልማት ላይ የሚደረገው ክርክር ቀጥሏል (ፎቶ፡ ጋዜጣዊ መግለጫ)

ምንም እንኳን አስደንጋጭ ሊመስል ቢችልም፣ የOpenAI ሞዴል ባህሪ ውጤቶች እስካሁን ድረስ እውነተኛ አደጋዎችን አይወክሉም፣ ምክንያቱም ቁጥጥር በማይደረግባቸው አካባቢዎች ይገኛል። ቢሆንም፣ ባለሙያዎች የደህንነት ንብርብሮቻቸውን ማሻሻል መቀጠል ጠቃሚ ነው።

በቴክኖሎጂ ኢንዱስትሪ ውስጥ ለረጅም ጊዜ የቆየ ክርክር ከፍተኛ አፈጻጸም ያላቸው የአይአይ ቴክኖሎጂዎች፣ በመመሪያም ሆነ በእውቀት የተመረጡ፣ ግባቸውን እንዳያሳኩ የሚያግድ እርምጃ ቢወስዱ ወይም ቢከለከሉ ምን ሊከሰት እንደሚችል ያነሳል።

ይህ ፈጽሞ ተከስቶ አያውቅም ማለት አንችልም፡- በሰኔ 2023 አንድ አርቲፊሻል ኢንተለጀንስ ድሮን መቆጣጠሪያ ኢላማዎቹን መግደል የሚችል ማሽንን በተናጥል መቆጣጠር ይችል እንደሆነ ለመገምገም የታሰበ ዋና ምናባዊ የአካባቢ ሙከራን ወድቋል። በዚያ አጋጣሚ፣ ሰዎች የሚገኙበት ምናባዊ ቦታ በAI ተደበደበ።.

ቀድሞውኑ በዚህ ዓመት በጥር ወር፣ አንትሮፖኒክየOpenAI ተፎካካሪ እንደመሆኑ መጠን ክፉ AIን መቀልበስ አልቻለም።...እራሷን እንዳትድን እና መጥፎ እንደሆኑ የሚታሰቡ እርምጃዎችን እንዳትወስድ ስለከለከለች ነው። ሁሉም ፈተና ብቻ ነበር፣ ነገር ግን ይህ ብልህነት በዕለት ተዕለት ሕይወታችን ውስጥ እየጨመረ መጥቷል። ታሪኩን በቅርበት እንከታተላለን።

ይህ በእንዲህ እንዳለ፣ ንገረን... አስተያየቶችእነዚህ የላቁ የቋንቋ ሞዴሎች ለሰው ልጅ ችግር ሊያስከትሉ እንደሚችሉ ያምናሉ?

ቪዲዮውን ይመልከቱ

እንዲሁም ይመልከቱ:

ከመረጃ ጋር፦ አርቢሲ-ዩክሬን

የተገመገመው በ ገብርኤል ፕሪንስቫል በ 06/12/2024


ስለ Showmetech ተጨማሪ ያግኙ

አዳዲስ ዜናዎቻችንን በኢሜል ለመቀበል ይመዝገቡ።

ተዛማጅ ልጥፎች
የክላውድ፣ የጌሚኒ፣ የቻትጂፕት እና የድንግዝግዝታ አርማዎችን የሚያሳዩ ስክሪኖች ያሉት የፎቶ እውነታዊ ትዕይንት።

ቻትጂፒቲ በአንድ ወር ሙከራ $20 ዋጋ ያለው ብቸኛው የክላውድ ተቀናቃኝ ነበር ይላል XDA።

ከXDA የወጣ አንድ ጽሑፍ ጀሚኒን፣ ቻትጂፒቲ እና ፐርፕሌክሲቲን ለአንድ ወር የክላውድን ምትክ አድርገው አነጻጽረዋል፤ ከአሸናፊው በተጨማሪ፣ በብራዚል ውስጥ ላሉ ተመዝጋቢዎች ዋና ዋና ዕቅዶች ምን ያህል እንደሚያስወጡ አሳይተናል።
የብሩኖ ማርቲኔዝ አምሳያ
ተጨማሪ ያንብቡ