2023-03-09 15:11:48 来源:商业新知网
JaLE(Japanese Language Evaluation),是译心针对日本商业应用对于大型语言模型的需求,推出的日文自然语言评测基准。通过多个的自然语言处理任务及大量标注数据集,为日文大模型的商业应用提供量化评测。
(资料图)
译心创始人兼CEO刘斌
“译心”——源于心,会于言。译心是大语言模型领域的技术创新公司,为海外商业客户提供基于大语言模型的在线客户服务和销售分析SaaS服务。
大语言模型即LLM(Large Language Model)。日本对大型语言模型的研发投入与中美相比差距很大,日文训练数据集和中英文相比数量很少,目前只有部分研发机构发布了基于T5-base和GPT2的十亿级参数的模型。
基于大型语言模型的在线客户服务和销售分析服务研发还处于起步阶段。而日本老龄化严重,人口负增长,品牌线上销售和客服的需求不断增大。日本云基础设施和SaaS服务近几年处于暴涨期,日本企业长期使用美国软件和互联网产品,本土AI和软件研发受到严重抑制。而美国SaaS公司日文数据少,本地服务差,无法和互联网巨头一样靠垄断平台进入日本市场。
在此情况下,针对日文领域大规模预训练模型和数据严重不足的问题,译心基于日本市场客户需求持续收集数据,推出了JaLE.ai,进行大规模通用和带标注任务数据集共享,推动学术界和工业界在不同商业应用领域的模型分享和数据评测。
据了解,JaLE与其他类似GLUE的评测平台相比,具有如下特点:
1.在通用语言理解的基础上,重点提供基于商业应用场景的任务和数据集;
2.除自然语言理解任务外,逐步增加自然语言生成任务,并提供系统性量化评测;
3.除数据集之外,平台将提供已在大量通用语料和数十个日文自然语言理解任务上进行训练的大模型,并持续进行模型优化。
未来JaLE.ai将结合学术界的最新研究成果,推动日文自然语言理解任务的标准化评测和模型共享,并为自然语言生成任务提供更多符合人类评价标准的量化评估指标。
译心核心技术团队毕业于清华大学、北京大学、中科院计算所、美国马萨诸塞大学等顶级研发机构,在信息检索和自然语言处理领域的平均研发时间超十年。
译心创始人兼CEO刘斌本科毕业于清华大学自动化系,2003年硕士毕业于中国科学院计算所,同年赴美国马萨诸塞大学攻读计算机科学博士。彼时互联网行业风起云涌,刘斌毅然退学回国,于2004年创立了易查手机搜索。易查作为中国移动互联网第一个手机搜索引擎的缔造者,为上亿中国手机用户提供搜索产品及服务。
易查于2006年进军日本市场,成为日本最大的移动运营商DoCoMo的搜索服务提供商,为超5000万i-mode用户提供官方推荐的手机搜索服务。易查日本服务数千家在线广告客户,年收入过2500万美元,深谙用户内容需求和客户营销需求。
刘斌作为长城会联合创始人,自2008年开始至今一直协助中日企业家进行商务对接,并参与举办全球移动互联网大会GMIC,这次再次出海创业将继续为中日技术和经贸桥梁添砖加瓦。
据刘斌透露,译心几位联合创始人自2019年起一直在大型语言模型领域进行工程化实践,致力于为海外商业客户提供基于大模型的自然对话和销售分析SaaS服务。
关键词:
物理界炸了!21℃实现室温超导,Nature凌晨刊发撤稿团队新研究,赌城现场被人群挤爆,有了这种材料,近常压超导和应用技术的黎明已经到来。
PromptEngineering全面自动化:LeCun看了沉默,ChatGPT看了直呼内行,不仅语言模型,包括几个月前很火的DALL·E,StableDiffusion等AI文本到图
1、有可能是因为苹果手机开启自动iCloud备份功能,您可以进入苹果手机的【设置】,点击第一项Apple ID选项,选择【iCloud】,找到备份后关
HP1010的硒鼓型号是HP2612A,通用机型:HP1020、HP1005、HP1018、佳能LBP-2900、LBP-3000等1、在开始页面内点击控制面板。space2、点击查看
在过去十年,人工智能(特别是深度学习)取得了显著成效。
近日,小红书正式推出了“时尚星火计划”,面向时尚行业的商家和主播提供百亿流量的扶持。
长久以来,我们的流行文化会将成功的职业女性刻画成疲于工作没有个人生活的女强人形象。
我并不确定你会不会忽然地出现在街角的咖啡店,但通用人工智能会出现在下一个街角,是确定的。
2023年公司资本开支水平将达到769亿元,其中算网投资占比将超过19%、同比增长超过20%。