一种有限制的将文本转换为音频的人工智能工具。
Meta推出了 NotebookLlama,这是 Google NotebookLM 播客生成工具的“开放”版本,但使用的是 Meta 的 Llama AI模型。NotebookLlama 处理上传的文本文件(例如 PDF 或博客文章),创建带有戏剧性和中断的播客式摘要,然后通过开放的文本转语音模型转换为语音。然而,早期的反馈表明,它的声音机械感较差,不太自然,有时声音重叠得有些尴尬。
Meta 的研究人员承认音频存在局限性,并表示使用更好的文本转语音模型可以提高质量。他们还建议改进格式,让两个 AI 代理讨论主题,而不是由单个模型处理提纲。
尽管人们做出了各种努力来复制 NotebookLM 的播客功能,但他们仍然难以应对 AI 的“幻觉”,导致生成的内容容易出现不准确的情况。
评论