买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:海南车智易通信息技术有限公司
摘要:本公开公开了训练生成文本生成模型的方法和文本生成方法。其中,训练生成文本生成模型的方法包括步骤:收集多个描述对象的文本,并生成文本中各段落对应的第一标签和第二标签,作为训练数据集;从训练数据集中选取出第一标签和第二标签均相同的第一数量个段落;从第一数量个段落中选取第二数量个句子,并对所选取的句子进行随机排序,作为第一子集;从第一数量个段落中选取第三数量个句子,作为第二子集;以及利用第一子集和所述第二子集,对初始的文本生成模型进行训练,得到训练好的文本生成模型,用来生成新的描述对象的文本。
主权项:1.一种训练生成文本生成模型的方法,包括步骤:收集多个描述对象的文本,并生成文本中各段落对应的第一标签和第二标签,作为训练数据集;从所述训练数据集中选取出第一标签和第二标签均相同的第一数量个段落;从所述第一数量个段落中选取第二数量个句子,并对所选取的句子进行随机排序,作为第一子集,包括:将所述第一数量个段落分为第一部分和第二部分;从所述第一部分所包含的各段落中分别选取2个句子,并结合所述第二部分中的所有句子,作为所选取的第二数量个句子;对所选取的第二数量个句子进行随机排序,作为第一子集,其中将所述第一数量个段落中除最后一个段落外的其它段落,作为第一部分,将所述第一数量个段落中的最后一个段落,作为第二部分;从所述第一数量个段落中选取第三数量个句子,作为第二子集,包括:将所述第一数量个段落中的最后一个段落中的所有句子,作为第二子集;以及利用所述第一子集和所述第二子集,对初始的文本生成模型进行训练,得到训练好的文本生成模型,用来生成新的描述对象的文本,其中利用所述第一子集和所述第二子集,对文本生成模型进行训练,得到训练好的文本生成模型的步骤包括:将所述第一子集作为输入数据,输入所述文本生成模型进行训练,得到输出数据;将所述第二子集作为目标数据,与所述输出数据计算损失函数,直到所述损失函数满足条件时,训练结束,得到训练好的文本生成模型。
全文数据:
权利要求:
百度查询: 海南车智易通信息技术有限公司 训练生成文本生成模型的方法及文本生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。