BMS, BUS, სამრეწველო, ინსტრუმენტული კაბელისთვის.

ილონ მასკმა და xAI-ის გუნდმა ოფიციალურად წარადგინეს Grok-ის უახლესი ვერსია, Grok3, პირდაპირი ტრანსლაციის დროს. ამ ღონისძიებამდე, მნიშვნელოვანი რაოდენობის დაკავშირებული ინფორმაციის, მასკის 24/7 სარეკლამო აჟიოტაჟთან ერთად, გლობალური მოლოდინები Grok3-ის მიმართ უპრეცედენტო დონემდე გაზარდა. სულ რაღაც ერთი კვირის წინ, მასკმა პირდაპირი ტრანსლაციის დროს, DeepSeek R1-ის კომენტირებისას, თავდაჯერებულად განაცხადა: „xAI აპირებს უკეთესი AI მოდელის გამოშვებას“. პირდაპირ ეთერში წარმოდგენილი მონაცემებიდან, როგორც ამბობენ, Grok3-მა გადააჭარბა ყველა ამჟამინდელ მეინსტრიმ მოდელს მათემატიკის, მეცნიერებისა და პროგრამირების საორიენტაციო მაჩვენებლებში, მასკმა კი განაცხადა, რომ Grok3 გამოყენებული იქნება SpaceX-ის მარსის მისიებთან დაკავშირებული გამოთვლითი ამოცანებისთვის და იწინასწარმეტყველა „სამ წელიწადში ნობელის პრემიის დონის გარღვევა“. თუმცა, ამჟამად ეს მხოლოდ მასკის განცხადებებია. გამოშვების შემდეგ, მე გამოვცადე Grok3-ის უახლესი ბეტა ვერსია და დავსვი კლასიკური ხრიკული კითხვა დიდი მოდელებისთვის: „რომელია უფრო დიდი, 9.11 თუ 9.9?“ სამწუხაროდ, ყოველგვარი კვალიფიკაციის ან შეფასებების გარეშე, ე.წ. ყველაზე ჭკვიან Grok3-ს მაინც არ შეეძლო ამ კითხვაზე სწორად პასუხის გაცემა. Grok3-მა ვერ შეძლო კითხვის მნიშვნელობის ზუსტად განსაზღვრა.
ამ ტესტმა სწრაფად მიიპყრო მრავალი მეგობრის ყურადღება და, დამთხვევით, საზღვარგარეთ ჩატარებულმა სხვადასხვა მსგავსმა ტესტებმა აჩვენა, რომ Grok3-ს უჭირდა ფიზიკის/მათემატიკის საბაზისო კითხვებზე პასუხის გაცემა, როგორიცაა „რომელი ბურთი ვარდება პირველი პიზის დახრილი კოშკიდან?“. ამიტომ, მას იუმორისტულად შეარქვეს „გენიოსი, რომელსაც არ სურს მარტივ კითხვებზე პასუხის გაცემა“.

Grok3 კარგია, მაგრამ R1-ზე ან o1-Pro-ზე უკეთესი არ არის.
პრაქტიკაში Grok3-მა ბევრ საერთო ცოდნის ტესტში „ჩავარდნები“ განიცადა. xAI-ის გაშვების ღონისძიების დროს, მასკმა აჩვენა, თუ როგორ გამოიყენა Grok3 თამაშიდან Path of Exile 2-ის პერსონაჟების კლასები და ეფექტები, რომელსაც, მისი თქმით, ხშირად თამაშობდა, თუმცა Grok3-ის მიერ გაცემული პასუხების უმეტესობა არასწორი იყო. პირდაპირი ტრანსლაციის დროს მასკმა ეს აშკარა პრობლემა ვერ შეამჩნია.
ამ შეცდომამ არა მხოლოდ დამატებითი მტკიცებულება მისცა უცხოელ ინტერნეტმომხმარებლებს, რათა დასცინოდნენ მასკს თამაშებში „ალტერნატივის პოვნის“ გამო, არამედ მნიშვნელოვანი შეშფოთება გამოიწვია Grok3-ის საიმედოობასთან დაკავშირებით პრაქტიკულ გამოყენებაში. ასეთი „გენიოსისთვის“, მისი რეალური შესაძლებლობების მიუხედავად, მისი საიმედოობა უკიდურესად რთულ აპლიკაციურ სცენარებში, როგორიცაა მარსის კვლევის ამოცანები, ეჭვქვეშ რჩება.
ამჟამად, ბევრი ტესტერი, რომლებმაც Grok3-ზე წვდომა კვირის წინ მიიღეს და ისინი, ვინც მოდელის შესაძლებლობები გუშინ რამდენიმე საათის განმავლობაში გამოსცადეს, საერთო დასკვნამდე მიდიან: „Grok3 კარგია, მაგრამ ის R1-ზე ან o1-Pro-ზე უკეთესი არ არის“.

კრიტიკული პერსპექტივა „Nvidia-ს დანგრევაზე“
გამოშვების დროს ოფიციალურად წარმოდგენილ PPT-ში, Grok3 Chatbot Arena-ში „ბევრად წინ“ იყო ნაჩვენები, თუმცა ამ პრეზენტაციაში გრაფიკული ტექნიკა ჭკვიანურად იყო გამოყენებული: ლიდერბორდზე ვერტიკალურ ღერძზე მხოლოდ 1400-1300 ქულის დიაპაზონის შედეგები იყო მითითებული, რაც ტესტის შედეგებში თავდაპირველ 1%-იან სხვაობას ამ პრეზენტაციაში განსაკუთრებით მნიშვნელოვნად აქცევს.

მოდელის რეალური შეფასების შედეგებში, Grok3 მხოლოდ 1-2%-ით უსწრებს DeepSeek R1-სა და GPT-4.0-ს, რაც შეესაბამება მრავალი მომხმარებლის გამოცდილებას პრაქტიკულ ტესტებში, რომლებმაც „შესამჩნევი განსხვავება ვერ გამოავლინეს“. Grok3 თავის მემკვიდრეებს მხოლოდ 1%-2%-ით აღემატება.

მიუხედავად იმისა, რომ Grok3-მა ყველა საჯაროდ ტესტირებულ მოდელზე მაღალი ქულები დააგროვა, ბევრი ამას სერიოზულად არ აღიქვამს: ბოლოს და ბოლოს, xAI ადრეც გააკრიტიკეს Grok2-ის ეპოქაში „ქულების მანიპულირებისთვის“. როდესაც ლიდერბორდმა პასუხის სიგრძის სტილი დააჯარიმა, ქულები მნიშვნელოვნად შემცირდა, რამაც ინდუსტრიის წარმომადგენლები ხშირად აკრიტიკებენ „მაღალი ქულის, მაგრამ დაბალი უნარის“ ფენომენს.
ლიდერბორდის „მანიპულირებით“ თუ ილუსტრაციებში დიზაინის ხრიკებით, ისინი ავლენენ xAI-ს და მასკის აკვიატებას მოდელების შესაძლებლობების „ლიდერობის“ იდეით. მასკმა ამ მარჟებისთვის დიდი ფასი გადაიხადა: გამოშვების დროს მან დაიკვეხნა 200,000 H100 გრაფიკული პროცესორის გამოყენებით (პირდაპირი ტრანსლაციის დროს „100,000-ზე მეტი“) და 200 მილიონი საათის ტრენინგის საერთო დროით. ამან ზოგიერთს აფიქრებინა, რომ ეს გრაფიკული პროცესორების ინდუსტრიისთვის კიდევ ერთ მნიშვნელოვან სიკეთეს წარმოადგენს და DeepSeek-ის გავლენა სექტორზე „სისულელედ“ მიიჩნია. აღსანიშნავია, რომ ზოგიერთი მიიჩნევს, რომ მოდელების ტრენინგის მომავალი მხოლოდ გამოთვლითი სიმძლავრე იქნება.
თუმცა, ზოგიერთმა ინტერნეტმომხმარებელმა DeepSeek V3-ის შესაქმნელად შეადარა 2000 H800 გრაფიკული დაფის ორი თვის განმავლობაში მოხმარება და გამოთვალა, რომ Grok3-ის ვარჯიშის დროს ენერგიის რეალური მოხმარება V3-ის ენერგომოხმარებას 263-ჯერ აღემატება. DeepSeek V3-ს, რომელმაც 1402 ქულა დააგროვა, და Grok3-ს შორის სხვაობა 100 ქულაზე ოდნავ ნაკლებია. ამ მონაცემების გამოქვეყნების შემდეგ ბევრმა სწრაფად გააცნობიერა, რომ Grok3-ის, როგორც „მსოფლიოში ყველაზე ძლიერის“, ტიტულის უკან აშკარა ზღვრული სარგებლიანობის ეფექტი იმალება - უფრო დიდი მოდელების მიერ უფრო ძლიერი შესრულების გენერირების ლოგიკამ კლებადი შედეგი აჩვენა.

„მაღალი ქულის, მაგრამ დაბალი შესაძლებლობების“ მიუხედავად, Grok2-ს ჰქონდა X (Twitter) პლატფორმიდან მიღებული მაღალი ხარისხის პირველი მხარის მონაცემების უზარმაზარი რაოდენობა გამოყენების მხარდასაჭერად. თუმცა, Grok3-ის ტრენინგის დროს, xAI ბუნებრივად წააწყდა იმ „ჭერის“ პრობლემას, რომლის წინაშეც ამჟამად OpenAI დგას - პრემიუმ ტრენინგის მონაცემების ნაკლებობა სწრაფად ავლენს მოდელის შესაძლებლობების ზღვრულ სარგებლიანობას.
Grok3-ის დეველოპერები და მასკი, სავარაუდოდ, პირველები არიან, ვინც ამ ფაქტებს ღრმად გაიგებენ და ამოიცნობენ, სწორედ ამიტომ, მასკი სოციალურ მედიაში განუწყვეტლივ ახსენებს, რომ ვერსია, რომელსაც მომხმარებლები ამჟამად განიცდიან, „ჯერ კიდევ ბეტა ვერსიაა“ და რომ „სრული ვერსია მომდევნო თვეებში გამოვა“. მასკმა Grok3-ის პროდუქტის მენეჯერის როლი იკისრა და მომხმარებლებს კომენტარების განყოფილებაში სხვადასხვა პრობლემაზე გამოხმაურების მიცემაში შესთავაზა. შესაძლოა, ის დედამიწაზე ყველაზე მეტი გამომწერი პროდუქტის მენეჯერი იყოს.
მიუხედავად ამისა, ერთ დღეში Grok3-ის მუშაობამ უდავოდ შეშფოთება გამოიწვია მათთვის, ვინც უფრო ძლიერი დიდი მოდელების გასაწვრთნელად „უზარმაზარ გამოთვლით ძალას“ დაეყრდნობოდა: Microsoft-ის საჯაროდ ხელმისაწვდომი ინფორმაციის საფუძველზე, OpenAI-ის GPT-4-ის პარამეტრის ზომა 1.8 ტრილიონი პარამეტრია, რაც GPT-3-ის პარამეტრის ზომაზე ათჯერ მეტია. ჭორები ვარაუდობენ, რომ GPT-4.5-ის პარამეტრის ზომა შესაძლოა კიდევ უფრო დიდი იყოს.
მოდელის პარამეტრების ზომების ზრდასთან ერთად, ტრენინგის ხარჯებიც მკვეთრად იზრდება. Grok3-ის არსებობასთან ერთად, ისეთმა კონკურენტებმა, როგორიცაა GPT-4.5 და სხვები, რომლებსაც სურთ „ფულის დახარჯვა“ პარამეტრის ზომის მეშვეობით მოდელის უკეთესი შესრულების მისაღწევად, უნდა გაითვალისწინონ ის ზღვარი, რომელიც ახლა აშკარად ჩანს და დაფიქრდნენ, თუ როგორ გადალახონ იგი. ამ ეტაპზე, OpenAI-ის ყოფილმა მთავარმა მეცნიერმა, ილია სუცკევერმა, გასული წლის დეკემბერში განაცხადა: „წინასწარი ტრენინგი, რომელსაც ჩვენ ვიცნობთ, დასრულდება“, რაც კვლავ წამოიჭრა დისკუსიებში, რამაც გამოიწვია დიდი მოდელების ტრენინგის ნამდვილი გზის პოვნის მცდელობები.

ილიას შეხედულებამ ინდუსტრიაში განგაში ატეხა. მან ზუსტად იწინასწარმეტყველა ხელმისაწვდომი ახალი მონაცემების გარდაუვალი ამოწურვა, რამაც გამოიწვია სიტუაცია, როდესაც მონაცემთა შეგროვების გზით მუშაობის გაუმჯობესება შეუძლებელი იქნება და ამას წიაღისეული საწვავის ამოწურვას ადარებს. მან მიუთითა, რომ „ნავთობის მსგავსად, ინტერნეტში ადამიანის მიერ გენერირებული კონტენტი შეზღუდული რესურსია“. სუცკევერის პროგნოზით, მოდელების შემდეგი თაობა, წინასწარი ტრენინგის შემდეგ, ფლობს „ნამდვილ ავტონომიას“ და მსჯელობის შესაძლებლობებს, „ადამიანის ტვინის მსგავსი“.
დღევანდელი წინასწარ მომზადებული მოდელებისგან განსხვავებით, რომლებიც ძირითადად ეყრდნობიან შინაარსის შესაბამისობას (წინასწარ შესწავლილი მოდელის შინაარსის საფუძველზე), მომავალი ხელოვნური ინტელექტის სისტემები შეძლებენ ისწავლონ და შექმნან მეთოდოლოგიები პრობლემების გადასაჭრელად ადამიანის ტვინის „აზროვნების“ მსგავსი გზით. ადამიანს შეუძლია მიაღწიოს ფუნდამენტურ უნარებს საგანში მხოლოდ ძირითადი პროფესიული ლიტერატურის გამოყენებით, მაშინ როდესაც ხელოვნური ინტელექტის დიდ მოდელს მილიონობით მონაცემი სჭირდება მხოლოდ ყველაზე ძირითადი საწყისი დონის ეფექტურობის მისაღწევად. მაშინაც კი, როდესაც ფორმულირება ოდნავ იცვლება, ეს ფუნდამენტური კითხვები შეიძლება სწორად არ იყოს გაგებული, რაც აჩვენებს, რომ მოდელი ნამდვილად არ გაუმჯობესებულა ინტელექტის მხრივ: სტატიის დასაწყისში ნახსენები ძირითადი, მაგრამ გადაუჭრელი კითხვები ამ ფენომენის ნათელ მაგალითს წარმოადგენს.

დასკვნა
თუმცა, უხეში ძალის მიღმა, თუ Grok3 მართლაც შეძლებს ინდუსტრიისთვის იმის გამჟღავნებას, რომ „წინასწარ მომზადებული მოდელები დასასრულს უახლოვდება“, ეს მნიშვნელოვან შედეგებს მოიტანს სფეროსთვის.
შესაძლოა, მას შემდეგ, რაც Grok3-ის გარშემო აჟიოტაჟი თანდათანობით ჩაცხრება, ჩვენ კიდევ უფრო მეტ შემთხვევას ვიხილავთ, როგორიცაა ფეი-ფეი ლის მაგალითი „მაღალი ხარისხის მოდელების კონკრეტულ მონაცემთა ნაკრებზე მხოლოდ 50 დოლარად რეგულირების“ შესახებ, რაც საბოლოოდ ხელოვნური ინტელექტის განვითარების ნამდვილ გზას აღმოაჩენს.
საკონტროლო კაბელები
სტრუქტურირებული საკაბელო სისტემა
ქსელი და მონაცემები, ბოჭკოვანი კაბელი, პაჩკორდი, მოდულები, წინა პანელი
2024 წლის 16-18 აპრილი, ახლო აღმოსავლეთის ენერგეტიკა დუბაიში
2024 წლის 16-18 აპრილი, Securika, მოსკოვში
2024 წლის 9 მაისი, ახალი პროდუქტებისა და ტექნოლოგიების გაშვების ღონისძიება შანხაიში
2024 წლის 22-25 ოქტომბერი, SECURITY CHINA, პეკინი
2024 წლის 19-20 ნოემბერი, CONNECTED WORLD, სამხრეთ აფრიკა
გამოქვეყნების დრო: 2025 წლის 19 თებერვალი