# AIGC的应用
# 一、视频文稿
1、通过关键词使用爬虫技术抓取高赞或者高播放量的视频
实现方式:基于 python 的爬虫技术和相关框架 Scrapy,借助 requests、xpath 等扩展类库抓取视频。
2、提取视频文字稿
相关接口如下:
平台 | 接口 | 局限性 | 方案 | 收费情况 |
---|---|---|---|---|
飞书 | 语音文件识别接口 | 接口适合 60 秒以内音频识别 | 将长语音进行切割 | 暂时没发现收费一说 |
百度 | 音频文件转写 | 音频大小不超过500MB | 大的音频文件进行切割 | 2元/小时(音频的时长) |
以下是百度的语音转文字的收费
3、再分析彼此文字稿的关联性强不强
平台 | 接口 | 局限性 | 方案 | 收费情况 |
---|---|---|---|---|
百度 | 短文本相似度 | 文本约170个汉字 | 无 |
以下是 百度 的短文本相似度的收费情况,其他平台暂时没找到类似的API
# 二、长文案分段与纠错
1、长文案自动分段
暂时没找到相关的 API 进行简单的处理。
基于深度学习的方法:利用深度学习模型,如循环神经网络(RNN)、卷积神经网络(CNN)或Transformer等,对文本进行分段。这种方法可以处理更复杂的文本,但需要大量的训练数据和计算资源。
2、纠正文案中的错别字,标点符号等
平台 | 接口 | 局限性 | 方案 | 收费情况 |
---|---|---|---|---|
百度 | 文本纠错 | 输入限制550个汉字 | 见下图 | |
百度 | 文本纠错-高级版 | 字数上限1000字 | 见下图 | |
讯飞 | 文本纠错 | 不得超过2000个字符 | 见下图 |
百度文本纠错
百度文本纠错-高级版
讯飞纠错
除了价格和每次的字数不一致以外,还有一条重要的区别就是,百度会返回纠正之后的文本,而讯飞就只是单纯的告诉你哪里错了,并不会返回纠正之后文本。 经过多次同一篇文章纠错结果对比,纠错能力相同,所以从成本和便利的角度上看,建议使用百度的纠错能力。
# 三、类似 “觉悟” 的强化学习
To C 端的应用,会大概率的被大厂商优化掉,那么 To B端 的应用,被优化的概率没那么大。我们可以结合自己的业务,利用其他应用进行拼搭来进行强化学习,每次自我学习的结果根据打分进行惩罚机制,自我迭代。类似于基于大模型的私有化训练,然后模型精调(预训练,有监督精调,奖励训练,强化训练)等。目的是需要进化成专业高手,有自我意识去评判对与错,并思考和下一步引导。
# 四、关键词提取
提取文章或者文档,放进词库,人词库丰富字后,根据这些生成文稿。
平台 | 接口 | 局限性 | 方案 | 收费情况 |
---|---|---|---|---|
百度 | 关键词提取 | 最大 65535 个字符 | 见下图 |
# 其他发现
应用 | 简介 | 厂商 | 地址 | 申请条件 |
---|---|---|---|---|
通义智文 | 自由阅读分析文档中的关键内容信息 | 阿里 | https://tongyi.aliyun.com/zhiwen/home | 网页应用,没提供API |
声音定制 | 提供声音复刻、音色变换、声音定制等前沿语音能力,通过先进的深度学习技术,根据客户实际业务场景,提供针对性的语音技术产品,从而更有效、更专业地服务实际业务需求。普遍适用于智能客服、有声阅读、新闻播报、虚拟人、电商直播、短视频制作等场景。 | 腾讯 | https://cloud.tencent.com/document/product/1287 | 需要以企业的身份并提供营业执照进行申请,并提供语音材料等 |