Нейролента - подборка новостей о нейронных сетях, ChatGPT

AI Product | Igor Akimov

All about AI Product | Igor Akimov

2024-04-03 22:24:02

В одном из чатов поделились сравнением сервисов перевода видео

> Мои топ 3 (тарифы указываю релевантные для меня, но есть и другие):

1. Blipcut (https://videotranslator.blipcut.com/en/tool/edit)
Голос и перевод максимально приближенный к оригиналу/человеческому. Можно редактировать текст и переписать через chatgpt.
1 минута бесплатно.
7,5 часов перевода клонированным голосом за $300/год

2. Rask (https://app.rask.ai/)
Есть клонирование голоса, приятный мужской голос, есть синхронизация губ. Можно редактировать текст и переписать через chatgpt.
1 минута бесплатно.
5 часов - $450/мес

3. Kapwing (https://www.kapwing.com/)
Приятный голос, но не попадание в ударение все портит, можно редактировать текст, вырезать аудиодорожку без голоса, наложить субтитры.
4 минуты экспорт бесплатно/мес.
5 часов за $24/мес

Если найдете что-то лучше, буду благодарен за рекомендацию!
Видел вроде есть какие то colab notebooks для подобных задач.

Остальные:

Maestra (https://app.maestra.ai/voiceover-trial)
Приятный голос для озвучки аудиокниги, можно редактировать текст.
1 минута бесплатно.
$10/час или 5 часов за $54/мес

Nova.ai (https://app.wearenova.ai/video-editing)
Средний голос, можно редактировать текст.
10 мин (5 минут на одно видео) бесплатно.
5 часов - $55/мес

Synthesis (https://app.synthesys.live/video-translation/)
Низкое качество, голос скачет.
Бесплатно все 11минутное видео перевело, но почему-то ужало до 8 минут.

Vidnoz (https://www.vidnoz.com/video-translate.html)
Низкое качество.
4 минуты бесплатно.

Wavel.ai
(https://studio.wavel.ai/studio/ )Низкое качество.
1 минута бесплатно.

БОНУС: В яндекс.браузере есть закадровая озвучка для видео с YouTube/twitch/vk и других сервисов. Но ее можно включить и в других браузерах. Инструкция (https://github.com/ilyhalight/voice-over-translation)

2024-03-26 12:35:05

Кажется, можно закрыть вопрос, переводить ли на английский язык ваш запрос и ответ или нет. Гугл исследовал все за вас
https://arxiv.org/pdf/2403.04792.pdf

На 108 языковых парах и 6 больших датасетах, как с выбором из нескольких вариантов, так и со свободным ответом, сделали вывод, что PaLM 2 и GPT-4, а значит и многие другие, более современные, гораздо лучше работают с промптом на оригинальном языке, чем при переводе запроса на английский и потом ответа на оригинальный язык. Так что можно без проблем использовать русский
Вот даже кусочек диаграммки с русским, точность повышается с примерно 0,92 до 0,94

2024-03-18 11:34:13

На Кипре сегодня выходной, но есть несколько новостей, которыми хотел поделиться все равно
1. Илон Маск и его x.ai, как и обещал, выложил веса их ИИ Grok https://github.com/xai-org/grok-1

- 314B параметров! Весит почти 300 гигабайт
- Это Mixture of Experts модель, то есть 8 подсетей, из которых под конкретную задачу подбирается 2, позволяет на более слабом (ха-ха) железе запускать.
- Лицензия позволяет коммерческое использование
- Модель базовая, то есть просто дополняет текст следующим словом, на диалоговый режим и следование инструкциям она не заточена, но базовые модели как раз самые тяжелые, добивание под задачи может стоить десятки и сотни тысяч долларов, а вот тренировка базовой модели - миллионы.
- По бенчмаркам между 3.5 и 4 GPT (73% on MMLU, 62.9% GMSK, 63.2% HumanEval)
- 8K контекст, но есть возможность расширения

Короче, это круто, а то все Llama, да Llama, никакой конкуренции, я думаю нас ждет много классных опенсорсных решений на ее основе.

2024-01-25 20:33:14

О, свежие анонсы от OpenAI
https://openai.com/blog/new-embedding-models-and-api-updates
Новые эмбеддинги: маленькие, но мощные, по 3 и большие, но вообще крутые, по 5 :) которые ещё и резать можно, если для задачи вся размерность не нужна.
- Улучшили Gpt-3.5-turbo, которая ещё и дешевле на 50%/25% стала на входные и выходные токены
- Улучшили Gpt-4-turbo, стала лучше писать код и меньше лениться.
- Улучшили moderation api для проверки, не выводит ли сеть что-то запрещённое.
- Добавили роли на разные API ключи и аналитику использования.