这里会显示出您选择的修订版和当前版本之间的差别。
information:tutorial:vocaltune01 [2011/12/19 17:45] mi 创建 |
information:tutorial:vocaltune01 [2011/12/19 17:49] (当前版本) mi |
||
---|---|---|---|
行 1: | 行 1: | ||
- | 嘛...其实是在报道帖里面有提到...\\ | + | <WRAP round info 50%> |
+ | **作者与出处**\\ | ||
+ | **作者:迪亚大菠萝**\\ | ||
+ | [[http://bbs.ivocaloid.com/thread-46377-1-4.html]]</WRAP> | ||
+ | |||
+ | 嘛…其实是在报道帖里面有提到…\\ | ||
山寨了一部分VocalListener功能的某自作物\\ | 山寨了一部分VocalListener功能的某自作物\\ | ||
- | 呃...我把它叫做VocalTune\\ | + | 呃…我把它叫做VocalTune\\ |
\\ | \\ | ||
- | 离完成还有很远很远的距离...\\ | + | 离完成还有很远很远的距离…\\ |
心急了所以放了这个半半半成品上了OTL\\ | 心急了所以放了这个半半半成品上了OTL\\ | ||
\\ | \\ | ||
或许这里的人至少应该是知道VocalListener的\\ | 或许这里的人至少应该是知道VocalListener的\\ | ||
VocalListener的目标貌似是用人声原唱生成VSQ吧\\ | VocalListener的目标貌似是用人声原唱生成VSQ吧\\ | ||
- | 现在放上的这个东西毕竟是山寨的...\\ | + | 现在放上的这个东西毕竟是山寨的…\\ |
所以没办法从人声直接生成VSQ\\ | 所以没办法从人声直接生成VSQ\\ | ||
\\ | \\ | ||
行 22: | 行 27: | ||
\\ | \\ | ||
现在的版本很不易用,很不灵活,而且十分慢:(mikum1:) \\ | 现在的版本很不易用,很不灵活,而且十分慢:(mikum1:) \\ | ||
- | 下面的那个简单例子,计算时间花了2分钟... | + | 下面的那个简单例子,计算时间花了2分钟… |
行 30: | 行 35: | ||
\\ | \\ | ||
\\ | \\ | ||
- | 使用方法:\\ | + | **使用方法** :\\ |
\\ | \\ | ||
第一个要注意的事情是,这个程序不会在你机器上种木马啥的,\\ | 第一个要注意的事情是,这个程序不会在你机器上种木马啥的,\\ | ||
行 38: | 行 43: | ||
就是指的VOCALOID2\\ | 就是指的VOCALOID2\\ | ||
\\ | \\ | ||
- | 然后定义几个概念\\ | + | **然后定义几个概念\\ |
+ | ** \\ | ||
1、MIDI时间\\ | 1、MIDI时间\\ | ||
MIDI时间和我们播放声音文件那个时间是不同的\\ | MIDI时间和我们播放声音文件那个时间是不同的\\ | ||
行 51: | 行 57: | ||
VOCALOID默认空了4个小结出来,因为默认是4/4拍,所以就有\\ | VOCALOID默认空了4个小结出来,因为默认是4/4拍,所以就有\\ | ||
16个四分音符,每个四分音符长480个单位的MIDI时间\\ | 16个四分音符,每个四分音符长480个单位的MIDI时间\\ | ||
- | 16%%*%%480=7680个单位的MIDI时间\\ | + | 16<nowiki>*</nowiki>480=7680个单位的MIDI时间\\ |
\\ | \\ | ||
我想应该有人明白我想说的了,考虑到Tempo可能变化,\\ | 我想应该有人明白我想说的了,考虑到Tempo可能变化,\\ | ||
行 58: | 行 64: | ||
\\ | \\ | ||
\\ | \\ | ||
- | OK...现在是真的使用方法了...\\ | + | OK…现在是真的使用方法了…\\ |
\\ | \\ | ||
上面说了,你需要那3个东西\\ | 上面说了,你需要那3个东西\\ | ||
- | 所以,先找来原唱....注意,需要清唱,嗯我知道很难找\\ | + | 所以,先找来原唱….注意,需要清唱,嗯我知道很难找\\ |
- | (例子里面的原唱是我用无损版的原唱减去无损版的伴奏得到的...)\\ | + | (例子里面的原唱是我用无损版的原唱减去无损版的伴奏得到的…)\\ |
\\ | \\ | ||
打开Vocaloid,开始填音符。当然,你找得到MIDI的话\\ | 打开Vocaloid,开始填音符。当然,你找得到MIDI的话\\ | ||
也可以直接导入。要获得最好的效果,你需要将每个音符精确对位\\ | 也可以直接导入。要获得最好的效果,你需要将每个音符精确对位\\ | ||
- | 这个很麻烦,可能需要一遍又一遍地输出WAV....\\ | + | 这个很麻烦,可能需要一遍又一遍地输出WAV….\\ |
+ | \\ | ||
{{http://i81.photobucket.com/albums/j203/zhangli40002002/vt1.jpg?nolink&600x450}}\\ | {{http://i81.photobucket.com/albums/j203/zhangli40002002/vt1.jpg?nolink&600x450}}\\ | ||
\\ | \\ | ||
行 74: | 行 81: | ||
那么就是输出从MIDI时间19200到MIDI时间38400这个区间的东西\\ | 那么就是输出从MIDI时间19200到MIDI时间38400这个区间的东西\\ | ||
记住这个区间,待会儿用得着\\ | 记住这个区间,待会儿用得着\\ | ||
+ | \\ | ||
{{http://i81.photobucket.com/albums/j203/zhangli40002002/vt2.jpg?nolink&406x285}}\\ | {{http://i81.photobucket.com/albums/j203/zhangli40002002/vt2.jpg?nolink&406x285}}\\ | ||
\\ | \\ | ||
行 80: | 行 88: | ||
意思是,不改VOCALOID输出的文件\\ | 意思是,不改VOCALOID输出的文件\\ | ||
而原唱那个文件,要么切掉一部分,要么在前面加空白,\\ | 而原唱那个文件,要么切掉一部分,要么在前面加空白,\\ | ||
- | 总之让它们的波形(%%*%%说波形不太准确)对齐\\ | + | 总之让它们的波形(<nowiki>*</nowiki>说波形不太准确)对齐\\ |
\\ | \\ | ||
\\ | \\ | ||
编写一个配置文件,内容类似这样\\ | 编写一个配置文件,内容类似这样\\ | ||
- | ;========================\\ | + | |
- | <file>[VSQ] | + | ---- |
+ | |||
+ | <file> | ||
+ | [VSQ] | ||
Input=shizumeuta.vsq | Input=shizumeuta.vsq | ||
Output=output.vsq | Output=output.vsq | ||
行 103: | 行 114: | ||
</file> | </file> | ||
+ | ---- | ||
- | ;========================\\ | ||
{{http://i81.photobucket.com/albums/j203/zhangli40002002/vt3.jpg?nolink&600x449}}\\ | {{http://i81.photobucket.com/albums/j203/zhangli40002002/vt3.jpg?nolink&600x449}}\\ | ||
解释一下\\ | 解释一下\\ | ||
行 139: | 行 150: | ||
那么Max_Freq就填一个稍微大于C3频率(即293.66Hz)的值,比如330\\ | 那么Max_Freq就填一个稍微大于C3频率(即293.66Hz)的值,比如330\\ | ||
\\ | \\ | ||
- | 这两个如果不确定可以不填...那么默认的就会采用50-550的设置\\ | + | 这两个如果不确定可以不填…那么默认的就会采用50-550的设置\\ |
\\ | \\ | ||
Offset参数就是你上面输出Wav的开始位置,我这里设置为7680\\ | Offset参数就是你上面输出Wav的开始位置,我这里设置为7680\\ | ||
因为我的开始位置是刚好从黑掉的小节之后\\ | 因为我的开始位置是刚好从黑掉的小节之后\\ | ||
- | 4小节 %%*%% 每小节4个四分音符 %%*%%每个四分音符480MIDI时间=7680\\ | + | 4小节<nowiki> *</nowiki> 每小节4个四分音符<nowiki> *</nowiki>每个四分音符480MIDI时间=7680\\ |
\\ | \\ | ||
填好以后\\ | 填好以后\\ | ||
行 149: | 行 160: | ||
如果你完全不知道什么叫控制台/Console/Shell/Cmd的话\\ | 如果你完全不知道什么叫控制台/Console/Shell/Cmd的话\\ | ||
可以直接把所有的东西,即VSQ文件+2个wav文件+配置文件+VocalTune_CUI.exe\\ | 可以直接把所有的东西,即VSQ文件+2个wav文件+配置文件+VocalTune_CUI.exe\\ | ||
- | 放在一个文件夹里面,然后把配置文件拖到VocalTune_CUI.exe上面...\\ | + | 放在一个文件夹里面,然后把配置文件拖到VocalTune_CUI.exe上面…\\ |
{{http://i81.photobucket.com/albums/j203/zhangli40002002/vt4.jpg?nolink&600x389}}\\ | {{http://i81.photobucket.com/albums/j203/zhangli40002002/vt4.jpg?nolink&600x389}}\\ | ||
\\ | \\ | ||
然后等吧\\ | 然后等吧\\ | ||
- | 我这机器CPU是烤土豆E6300 DDR2 800的内存,等了2分钟...\\ | + | 我这机器CPU是烤土豆E6300 DDR2 800的内存,等了2分钟…\\ |
\\ | \\ | ||
- | 然后打开输出文件看看.....\\ | + | 然后打开输出文件看看…..\\ |
\\ | \\ | ||
- | 嘛...理想和现实总是有差距的(?),世上没有完美的东西(??)\\ | + | 嘛…理想和现实总是有差距的(?),世上没有完美的东西(??)\\ |
\\ | \\ | ||
总之,里面可能会有很多地方听起来很奇怪\\ | 总之,里面可能会有很多地方听起来很奇怪\\ | ||
原因可能有几个,\\ | 原因可能有几个,\\ | ||
一是频率检测不正确,这样的话,\\ | 一是频率检测不正确,这样的话,\\ | ||
- | 想想原唱是否杂音太大(比如包含了伴奏...)、最大最小频率设置是否有问题\\ | + | 想想原唱是否杂音太大(比如包含了伴奏…)、最大最小频率设置是否有问题\\ |
二是可能某些音符没能和原唱的对准\\ | 二是可能某些音符没能和原唱的对准\\ | ||
\\ | \\ | ||
行 168: | 行 179: | ||
\\ | \\ | ||
\\ | \\ | ||
- | 清唱的原唱啥的难找哎,所以考虑改造一下做成做对话的东西....\\ | + | 清唱的原唱啥的难找哎,所以考虑改造一下做成做对话的东西….\\ |
\\ | \\ | ||
关于软件的构成,\\ | 关于软件的构成,\\ | ||
行 175: | 行 186: | ||
snack本来是为脚本语言设计的,\\ | snack本来是为脚本语言设计的,\\ | ||
在vocaltune中进行了一些改装,使得它能够用到C++里面\\ | 在vocaltune中进行了一些改装,使得它能够用到C++里面\\ | ||
- | snack在BSD协议下.....外国人可真是慷慨啊(各种内纽曼面\\ | + | snack在BSD协议下…..外国人可真是慷慨啊(各种内纽曼面\\ |
\\ | \\ | ||
音量调节功能暂时还没弄╮(╯_╰)╭\\ | 音量调节功能暂时还没弄╮(╯_╰)╭\\ |