Перейти к содержимому
Advertisement

UK gov's Mythos AI tests help separate cybersecurity threat from hype

New model is the first AI system to complete a difficult multi-step infiltration challenge.

schedule 19:11 visibility 86 просмотров
UK gov's Mythos AI tests help separate cybersecurity threat from hype
Источник: Ars Technica

Last week, Anthropic announced it was restricting the initial release of its Mythos Preview model to "a limited group of critical industry partners," giving them time to prepare for a model that it said is "strikingly capable at computer security tasks." Now, the UK government's AI Security Institute (AISI) has published an initial evaluation of the model's cyber-attack capabilities that adds some independent public verification to those Anthropic reports.

AISI's findings show that Mythos isn't significantly different from other recent frontier models when it comes to tests of individual cyber-security related tasks. But Mythos could set itself apart from previous models through its ability to effectively chain these tasks together into the multi-step series of attacks necessary to fully infiltrate some systems.

"The Last Ones" finally falls

AISI has been putting various AI models through specially designed Capture the Flag challenges since early 2023, when GPT-3.5 Turbo struggled to complete any of the group's relatively low-level "Apprentice" tasks. Since then, performance of subsequent models has risen steadily, to the point where Mythos Preview can complete north of 85 percent of those same Apprentice-level CTF tasks.

Read full article

Comments

newspaper

Опубликовано на

Ars Technica

open_in_new Читать полную статью

Похожие статьи

Apple: Мессенджер "Макс" удален из App Store из-за санкций
Технологии

Apple: Мессенджер "Макс" удален из App Store из-за санкций

Компания Apple сообщила Русской службе BBC, что удалила российский госмессенджер "Макс" из своего магазина приложений, поскольку соблюдает санкции. О каких именно санкциях идет речь, в комментарии не уточняется.

DW Russian
Ferrari представила свой первый электромобиль
Технологии

Ferrari представила свой первый электромобиль

Ferrari представила свой первый электрический автомобиль с дизайном от бывшего главного дизайнера Apple. Luce разгоняется до 100 км/ч за 2,5 секунды и развивает скорость до 310 км/ч. Стоимость новинки - 550 тысяч евро.

DW Russian
Маск против Альтмана: Суд отклонил громкий иск против OpenAI
Технологии

Маск против Альтмана: Суд отклонил громкий иск против OpenAI

Федеральный суд в Окленде пришел к выводу, что Илон Маск слишком затянул с подачей иска против OpenAI и ее руководства в лице Сэма Альтмана. Судья присоединилась к выводам присяжных. Маск направит апелляцию.

DW Russian

Читать далее

Зумеры против ИИ? Нападения на дом создателя ChatGPT вызвали дискуссию о кризисе доверия к искусственному интеллекту
Технологии

Зумеры против ИИ? Нападения на дом создателя ChatGPT вызвали дискуссию о кризисе доверия к искусственному интеллекту

20-летний техасец обвиняется в покушении на жизнь главы ИИ-компании OpenAI, которая создала ChatGPT, Сэма Альтмана. Би-би-си поговорила с экспертами о том, что эти нападения говорят об отношение общества к ИИ и его создателям.

BBC Russian
Российский мессенджер Max признали шпионским приложением
Технологии

Российский мессенджер Max признали шпионским приложением

Крупнейший хостинг-провайдер Cloudflare пометил домен российского "национального" мессенджера Max как шпионское программное обеспечение. Ранее так же пометили приложение "Телега", после чего его удалили из App Store.

DW Russian
Много продаж, мало инноваций. Почему Apple решилась на смену гендиректора
Технологии

Много продаж, мало инноваций. Почему Apple решилась на смену гендиректора

Тим Кук, 15 лет назад возглавивший Apple после отставки Стива Джобса, уходит с поста гендиректора. С 1 сентября его место займет Джон Тернус, вице-президент по разработке аппаратного обеспечения. Последнее время Apple часто критикуют за отсутствие...

BBC Russian
Тим Кук уходит с поста гендиректора Apple и возглавит совет компании
Технологии

Тим Кук уходит с поста гендиректора Apple и возглавит совет компании

С 1 сентября новым гендиректором Apple станет Джон Тернус. Тим Кук, который возглавлял компанию на протяжении 15 лет, займет пост председателя совета директоров компании и продолжит курировать отношения с властями США.

DW Russian