ASR/MT
ASR/MT系統
我们采集的数据主要与「语音识别(Speech Recognition)」以及「机器翻译(machine translation)」技术的开发领域相关。我们可以为您提供由世界各地采集的语音数据和文本数据。与此同时,我们还可以提供多语种语音语料库(multilingual speech corpus)以及平行语料库(parallel corpus)用于学术研究和ASR/MT的系统开发。
遍布全球的专业数据收集人员以及工程师
虽然公司成立于于2016年,但我们的成员早于1980年代起就在世界各地从事语音收集领域,
在语音收集(SpeechDataCollection)领域,我公司的工作人员以及工程师有三十余年的丰富经验。三十年来,他们在世界各地不同的公司,曾经向Microsoft,Google以及在日本开发语音识别技术的电器商提供过语音数据。总而言之Timehill公司是语音数据的专家的聚集。
我们的优势
我们拥有大量的语音合成TTS(Text to Speech)数据,但我们的最大的强项应该是自由对话语音数据(Spontaneous Speech Data corpus)的采集。在此领域,我们拥有全球最大规模的采集数据,这些数据目前正在被以日本东京大学为首的科研机构用于学术研究,以及世界各地的IT公司用于ASR/MT的系统开发。
时岗洋一,创始人兼CEO
他在设计高效富有创造力的研究以及数据采集方法上很有名望。采集文本数据,语音数据,图像视频诗句以及手机程序开发电脑软件开发等领域被熟知。在客户诉求解决上,具有很敏锐的洞察力(餐饮酒店业)。他毕业于早稻田大学研究生院,和东京大学的K. Hirose教授联合发表多篇有价值的科学论文和书籍。曾经是亚太MT系统学会会员(- http://www.aamt.info/japanese/news/)。他身在京都但是他为了研究和事业足迹遍布全球。人们说他的飞行里程比飞行员还多。
欢迎合作
在此欢迎贵司在开发语音识别技术领域使用敝司提供的语音库。如有需求可直接拜访洽谈。
欢迎邮件联系我们,我们将在一周之内回复您的邮件。
■声音数据的收集■
为了ASR/MT的系统发展,我们非常乐意为您提供从世界各地采集的大规模语音数据服务。
【特点】
覆盖全球、大规模
1)覆盖地区50多个国家(全球200多个城市)
北美~中美~南美各国
北欧~波罗的海三国
欧洲各国
非洲各国
中东各国
全亚洲
大洋洲以及太平洋群岛各国
更高的质量
•专业的录音团队
•录音参与者属性:男女性别比可同等(3~100岁)
•对录音参与者母语水平的严格评价。
•我们从不使用同一位参与者两次。
•严格控制样本制备和产品服务规格。
•弃权回答率低于5%。
更快的速度
•几乎“随时随地”。
•无与伦比的项目周转力。
•24小时数据传输的实时结果。
<例如>
>每人10分钟 : 每天200人
>每人 20-30分钟: 每天20人
>总计 :每周可以完成100-1000人次的录音任务
更低的成本
•样本和募集成本低。
•在众多调研地点,无需支付昂贵的场地使用费用。
【类型特征】
录音风格
自由对话(可以提供方案引导两者进行自由对话)
大声朗读(朗读100%无误)
录音机器
立式麦克风
耳机麦克风
衣领麦克风
边界麦克风
智能手机(苹果、安卓)
收录地点
专业录音室
会议室
户外
采样率和录音通道
•8 kHz, 16 bit
•16 kHz, 16 bit
•22 kHw, 16 bit
•44 kHw, 16 bit
•48 kHw, 16 bit
录音类型
朗读录音
情感语音
耳语语音
自由演讲
双语演讲
讲演语音
两者对话
三者以上对话
演唱语音
歌曲哼唱
如提供数据有缺欠,我们会更改到100%正确为止。不收任何追加费用。
*转写服务单独收费