У Meta* появился свой генератор подкастов — NotebookLlama. Этот инструмент создает диалоги на основе текстовых файлов, аналогично функции в Google NotebookLM.
NotebookLlama берет, к примеру, PDF-файл со статьей, преобразует его в текст, добавляет немного драматизации и «прерываний», а затем передает получившийся текст в модель для озвучивания.
Однако качество звука пока не идеальное: голоса звучат немного роботизированно и иногда накладываются друг на друга. Исследователи Meta отмечают, что с помощью более продвинутых моделей можно улучшить звучание. Также они планируют добавить элементы дебатов, чтобы сделать подкасты более динамичными.
Тем не менее, остается проблема с «галлюцинациями», когда ИИ может генерировать вымышленные факты. Это, к сожалению, характерно для многих подобных проектов.
* Деятельность Meta (руководящая компания Instagram и Facebook) запрещена в России.