# AIGC的应用

# 一、视频文稿

1、通过关键词使用爬虫技术抓取高赞或者高播放量的视频

实现方式:基于 python 的爬虫技术和相关框架 Scrapy,借助 requests、xpath 等扩展类库抓取视频。

2、提取视频文字稿

相关接口如下:

平台 接口 局限性 方案 收费情况
飞书 语音文件识别接口 接口适合 60 秒以内音频识别 将长语音进行切割 暂时没发现收费一说
百度 音频文件转写 音频大小不超过500MB 大的音频文件进行切割 2元/小时(音频的时长)

以下是百度的语音转文字的收费

3、再分析彼此文字稿的关联性强不强

平台 接口 局限性 方案 收费情况
百度 短文本相似度 文本约170个汉字

以下是 百度 的短文本相似度的收费情况,其他平台暂时没找到类似的API

# 二、长文案分段与纠错

1、长文案自动分段

暂时没找到相关的 API 进行简单的处理。

基于深度学习的方法:利用深度学习模型,如循环神经网络(RNN)、卷积神经网络(CNN)或Transformer等,对文本进行分段。这种方法可以处理更复杂的文本,但需要大量的训练数据和计算资源。

2、纠正文案中的错别字,标点符号等

平台 接口 局限性 方案 收费情况
百度 文本纠错 输入限制550个汉字 见下图
百度 文本纠错-高级版 字数上限1000字 见下图
讯飞 文本纠错 不得超过2000个字符 见下图

百度文本纠错

百度文本纠错-高级版

讯飞纠错

除了价格和每次的字数不一致以外,还有一条重要的区别就是,百度会返回纠正之后的文本,而讯飞就只是单纯的告诉你哪里错了,并不会返回纠正之后文本。 经过多次同一篇文章纠错结果对比,纠错能力相同,所以从成本和便利的角度上看,建议使用百度的纠错能力。

# 三、类似 “觉悟” 的强化学习

To C 端的应用,会大概率的被大厂商优化掉,那么 To B端 的应用,被优化的概率没那么大。我们可以结合自己的业务,利用其他应用进行拼搭来进行强化学习,每次自我学习的结果根据打分进行惩罚机制,自我迭代。类似于基于大模型的私有化训练,然后模型精调(预训练,有监督精调,奖励训练,强化训练)等。目的是需要进化成专业高手,有自我意识去评判对与错,并思考和下一步引导。

# 四、关键词提取

提取文章或者文档,放进词库,人词库丰富字后,根据这些生成文稿。

平台 接口 局限性 方案 收费情况
百度 关键词提取 最大 65535 个字符 见下图

# 其他发现

应用 简介 厂商 地址 申请条件
通义智文 自由阅读分析文档中的关键内容信息 阿里 https://tongyi.aliyun.com/zhiwen/home 网页应用,没提供API
声音定制 提供声音复刻、音色变换、声音定制等前沿语音能力,通过先进的深度学习技术,根据客户实际业务场景,提供针对性的语音技术产品,从而更有效、更专业地服务实际业务需求。普遍适用于智能客服、有声阅读、新闻播报、虚拟人、电商直播、短视频制作等场景。 腾讯 https://cloud.tencent.com/document/product/1287 需要以企业的身份并提供营业执照进行申请,并提供语音材料等