iEziic
2021-09-12T14:51:26+00:00
如题,大四,准备挑战自我,做自己想做的项目,阿里云tts可视化
简单的说,阿里有个文字转语音系统,但是只有原子集成没有界面,我想趁着毕业设计把这个东西给做出来,套个壳
学校挺水的,老师那边已经允许了
目前是打算做成网页端和小程序(没接触太多,本学期开课,不知道有没有路子,不行我就改原生app),可能要用到以下功能:
1.用户和vip系统,需要增加付费功能,但这个接口不太了解
2.将文件从阿里云的服务器下载到服务器再下载到设备上,完全不知道咋操作
3.语音线上编辑,比如说把语音像抖音那样裁剪,拼接的功能得有,而且是在前台
此外,分层和基础架构上这方面我是完全的弱项,ssm ssh javaee和jsp都没学好,h5马马虎虎,但也只是能做个东西的水准,上不了台面,想问问老哥现在最时兴最简单的架构是什么,能给小程序和网页端用的那种,求指点
我的强项:清楚的知道自己要做个啥,审美水平和美工力足,题材新,剪辑视频时积累了功底
因为tts是阿里的所以工程量不能算只能算美工,听说好像有集成了美工的框架有直接可用的好看元件,不知道有没有老哥推荐下好用的框架
第一步其实就会难住你,付费的话要申请商户,个人是没法申请的。
会h5全用前端技术栈写就行了,感觉这毕设题太水了,建议再想想
作为TTS算法工程师,给你个建议
市面的厂子都会提供TTS的demo页面,以及有些会有长文本合成界面。可以F12拉下来研究,然后套个electron
API调取方法基本就是websocket那些,不难
音频剪辑嘛。。不确定浏览器标准里有没有对应的功能。一般后端解音频一般就是用sox,ffmpeg啥的
B站或者培训班找个类似的视频系列跟着做?我本科毕设就是跟b站up主的视频做的
这感觉基本上全是前端的内容啊,留个接口让用户自己输key和id然后调用阿里的api就行了
看了半天我其实真没太明白你要做什么
如果我没理解错的话 你需要的核心功能是
开一个网页
网页有一个文本框和提交按钮
文本框可以输入文字
然后点击提交到服务器后端
服务后端处理转发请求并返回音频
(以上是1小时的工作量)
然后在此基础上把加个用户登录注册系统(这个基本是1天的工作量)
前端页面有在线编辑功能,要酷炫一些(这个不好估,但我觉得主要难点在这 没原型没方案没设计 鉴于你没说自己会js 暂且估3个月)
[quote][pid=550442074,28525159,1]Reply[/pid] Post by [uid=12075406]TheBeet[/uid] (2021-09-16 00:53):
看了半天我其实真没太明白你要做什么
如果我没理解错的话 你需要的核心功能是
开一个网页
网页有一个文本框和提交按钮
文本框可以输入文字
然后点击提交到服务器后端
服务后端处理转发请求并返回音频
(以上是1小时的工作量)
然后在此基础上把加个用户登录注册系统(这个基本是1天的工作量)
前端页面有在线编辑功能,要酷炫一些(这个不好估,但我觉得主要难点在这 没原型没方案没设计 鉴于你没说自己会js 暂且估3个月)[/quote]原型方案设计我还真有,大三就做出来了,问题是前面的功能怎么实现
[quote][pid=550433362,28525159,1]Reply[/pid] Post by [uid=5443356]KnightLolicon[/uid] (2021-09-16 00:11):
作为TTS算法工程师,给你个建议
市面的厂子都会提供TTS的demo页面,以及有些会有长文本合成界面。可以F12拉下来研究,然后套个electron
API调取方法基本就是websocket那些,不难
音频剪辑嘛。。不确定浏览器标准里有没有对应的功能。一般后端解音频一般就是用sox,ffmpeg啥的[/quote]前端做处理区别不大,ffmpeg有浏览器版本,按你的说法,都electron了,加个ffmpeg在子进程跑其实也行,gui使用任意一种web技术难度都不大。
本科毕设这玩意,不会高到哪里去,多线程啥的都不用太考虑。
但关键是楼主大四,现在是9月,哪里不对?
[quote][pid=550429564,28525159,1]Reply[/pid] Post by [uid=60577]ryo_cn[/uid] (2021-09-15 23:54):
第一步其实就会难住你,付费的话要申请商户,个人是没法申请的。[/quote]有个皮包公司可以挂
而且这玩意我自己也在用,大不了开放个允许私人key接入就行
[quote][pid=550433362,28525159,1]Reply[/pid] Post by [uid=5443356]KnightLolicon[/uid] (2021-09-16 00:11):
作为TTS算法工程师,给你个建议
市面的厂子都会提供TTS的demo页面,以及有些会有长文本合成界面。可以F12拉下来研究,然后套个electron
API调取方法基本就是websocket那些,不难
音频剪辑嘛。。不确定浏览器标准里有没有对应的功能。一般后端解音频一般就是用sox,ffmpeg啥的[/quote]好的,对了问一下,如果想进tts相关公司有什么路子吗