ИИ-кукушка или Life-to-Vec. Пять лет назад писал
ИИ-кукушка или Life-to-Vec
Пять лет назад писал текст про ИИ-гадалку.
С тех пор появились трансформеры и вот кто-то наконец попробовал подучить ИИ предугадывать жизненные события на основе .. правильно предыдущих жизненных событий.
Нас уже не удивишь тем, как ловко LLM продолжают тексты и отвечают на вопросы. Все это благодаря тому, что с помощью преобразования word-to-vec слова можно векторизовать, то есть перевести их в наборы цифр, сильно пожав по дороге.
А что мешает взять не слова, а события из жизни? И если архитектура трансформеров так ловко предсказывает следующий вектор(ембединг), то осталось где-то взять жирномясый датасет с описаниями жизненных событий и попросить ИИ их, так сказать, продолжать.
А датасет нашелся в Дании, где данные для обучения модели life2vec были взяты из информации о рынке труда и данных Национального регистра пациентов и статистического управления Дании. Набор данных включает в себя информацию обо всех 6 млн датчан и содержит сведения о доходах, заработной плате, стипендии, типе работы, отрасли, социальных пособиях и т.д. Набор медицинских данных включает записи о посещениях медицинских работников или больниц, диагнозе, типе пациента и насколько внезапным или срочным было обращение за медицинской помощью. Данные для модели представлены за период с 2008 по 2020 годы, хотя по ограниченной возрастной группе данные брались за период с 2008 по 2016 годы.
На итоге получилась Large Life Model, которая может предсказывать разные события в жизни кожаного вплоть до смерти. А если подкормить ее данными с телефона (как я писал 5 лет назад), то там точность возрастает еще сильнее.
Так что ваш любимый стохастический попугай превращается в ИИ-кукушку, которая накукует вам сколько еще осталось.
Выглядит как шутка, звучит как шутка, но шуткой более не является. ИИ слишком хорошо умеет в продолжения последовательностей.
Читайте тут, с осторожностью, сильно не по себе:
https://www.nature.com/articles/s43588-023-00573-5
Звучит, как сценарий из фильма:
"Здесь мы представляем человеческие жизни в виде структурного сходства с языком и используем это сходство для адаптации методов обработки естественного языка, чтобы изучить эволюцию и предсказуемость человеческих жизней на основе подробных последовательностей событий. Для этого мы используем всеобъемлющую базу данных реестра, которая доступна для Дании за несколько лет и включает информацию о жизненных событиях, связанных со здоровьем, образованием, профессией, доходом, адресом и рабочим временем, зарегистрированных с ежедневным разрешением. Мы создаем вложения жизненных событий в единое векторное пространство, показывая, что это пространство вложений является надежным и высокоструктурированным. Наши модели позволяют предсказывать различные результаты, начиная от ранней смертности и заканчивая личностными особенностями, с большим отрывом превосходя современные модели. Используя методы интерпретации моделей глубокого обучения, мы исследуем алгоритм, чтобы понять факторы, которые позволяют нам предсказывать. Наша система позволяет исследователям обнаружить потенциальные механизмы, влияющие на жизненные результаты, а также связанные с ними возможности для персонализированных вмешательств."
Пять лет назад писал текст про ИИ-гадалку.
С тех пор появились трансформеры и вот кто-то наконец попробовал подучить ИИ предугадывать жизненные события на основе .. правильно предыдущих жизненных событий.
Нас уже не удивишь тем, как ловко LLM продолжают тексты и отвечают на вопросы. Все это благодаря тому, что с помощью преобразования word-to-vec слова можно векторизовать, то есть перевести их в наборы цифр, сильно пожав по дороге.
А что мешает взять не слова, а события из жизни? И если архитектура трансформеров так ловко предсказывает следующий вектор(ембединг), то осталось где-то взять жирномясый датасет с описаниями жизненных событий и попросить ИИ их, так сказать, продолжать.
А датасет нашелся в Дании, где данные для обучения модели life2vec были взяты из информации о рынке труда и данных Национального регистра пациентов и статистического управления Дании. Набор данных включает в себя информацию обо всех 6 млн датчан и содержит сведения о доходах, заработной плате, стипендии, типе работы, отрасли, социальных пособиях и т.д. Набор медицинских данных включает записи о посещениях медицинских работников или больниц, диагнозе, типе пациента и насколько внезапным или срочным было обращение за медицинской помощью. Данные для модели представлены за период с 2008 по 2020 годы, хотя по ограниченной возрастной группе данные брались за период с 2008 по 2016 годы.
На итоге получилась Large Life Model, которая может предсказывать разные события в жизни кожаного вплоть до смерти. А если подкормить ее данными с телефона (как я писал 5 лет назад), то там точность возрастает еще сильнее.
Так что ваш любимый стохастический попугай превращается в ИИ-кукушку, которая накукует вам сколько еще осталось.
Выглядит как шутка, звучит как шутка, но шуткой более не является. ИИ слишком хорошо умеет в продолжения последовательностей.
Читайте тут, с осторожностью, сильно не по себе:
https://www.nature.com/articles/s43588-023-00573-5
Звучит, как сценарий из фильма:
"Здесь мы представляем человеческие жизни в виде структурного сходства с языком и используем это сходство для адаптации методов обработки естественного языка, чтобы изучить эволюцию и предсказуемость человеческих жизней на основе подробных последовательностей событий. Для этого мы используем всеобъемлющую базу данных реестра, которая доступна для Дании за несколько лет и включает информацию о жизненных событиях, связанных со здоровьем, образованием, профессией, доходом, адресом и рабочим временем, зарегистрированных с ежедневным разрешением. Мы создаем вложения жизненных событий в единое векторное пространство, показывая, что это пространство вложений является надежным и высокоструктурированным. Наши модели позволяют предсказывать различные результаты, начиная от ранней смертности и заканчивая личностными особенностями, с большим отрывом превосходя современные модели. Используя методы интерпретации моделей глубокого обучения, мы исследуем алгоритм, чтобы понять факторы, которые позволяют нам предсказывать. Наша система позволяет исследователям обнаружить потенциальные механизмы, влияющие на жизненные результаты, а также связанные с ними возможности для персонализированных вмешательств."
Источник: Метаверсище и ИИще
2023-12-28 14:49:07