# AIGC的应用

# 一、视频文稿

1、通过关键词使用爬虫技术抓取高赞或者高播放量的视频

实现方式：基于 python 的爬虫技术和相关框架 Scrapy，借助 requests、xpath 等扩展类库抓取视频。

2、提取视频文字稿

平台	接口	局限性	方案	收费情况
飞书	语音文件识别接口	接口适合 60 秒以内音频识别	将长语音进行切割	暂时没发现收费一说
百度	音频文件转写	音频大小不超过500MB	大的音频文件进行切割	2元/小时（音频的时长）

平台	接口	局限性	方案	收费情况
百度	短文本相似度	文本约170个汉字	无

# 二、长文案分段与纠错

1、长文案自动分段

暂时没找到相关的 API 进行简单的处理。

基于深度学习的方法：利用深度学习模型，如循环神经网络（RNN）、卷积神经网络（CNN）或Transformer等，对文本进行分段。这种方法可以处理更复杂的文本，但需要大量的训练数据和计算资源。

2、纠正文案中的错别字，标点符号等

平台	接口	局限性	收费情况
百度	文本纠错	输入限制550个汉字	见下图
百度	文本纠错-高级版	字数上限1000字	见下图
讯飞	文本纠错	不得超过2000个字符	见下图

百度文本纠错

百度文本纠错-高级版

讯飞纠错

除了价格和每次的字数不一致以外，还有一条重要的区别就是，百度会返回纠正之后的文本，而讯飞就只是单纯的告诉你哪里错了，并不会返回纠正之后文本。经过多次同一篇文章纠错结果对比，纠错能力相同，所以从成本和便利的角度上看，建议使用百度的纠错能力。

# 三、类似 “觉悟” 的强化学习

To C 端的应用，会大概率的被大厂商优化掉，那么 To B端 的应用，被优化的概率没那么大。我们可以结合自己的业务，利用其他应用进行拼搭来进行强化学习，每次自我学习的结果根据打分进行惩罚机制，自我迭代。类似于基于大模型的私有化训练，然后模型精调（预训练，有监督精调，奖励训练，强化训练）等。目的是需要进化成专业高手，有自我意识去评判对与错，并思考和下一步引导。

# 四、关键词提取

提取文章或者文档，放进词库，人词库丰富字后，根据这些生成文稿。

平台	接口	局限性	方案	收费情况
百度	关键词提取	最大 65535 个字符		见下图

# 其他发现

应用	简介	厂商	地址	申请条件
通义智文	自由阅读分析文档中的关键内容信息	阿里	https://tongyi.aliyun.com/zhiwen/home	网页应用，没提供API
声音定制	提供声音复刻、音色变换、声音定制等前沿语音能力，通过先进的深度学习技术，根据客户实际业务场景，提供针对性的语音技术产品，从而更有效、更专业地服务实际业务需求。普遍适用于智能客服、有声阅读、新闻播报、虚拟人、电商直播、短视频制作等场景。	腾讯	https://cloud.tencent.com/document/product/1287	需要以企业的身份并提供营业执照进行申请，并提供语音材料等

← 百度千帆-知识库开源项目 FAST-GPT →