上海大学武星获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海大学申请的专利一种基于自适应编码的蛋白存储文件管理系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116841956B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211499963.1,技术领域涉及:G06F16/11;该发明授权一种基于自适应编码的蛋白存储文件管理系统及方法是由武星;胡宏岗;董昕;苏笠;胡明涛设计研发完成,并于2022-11-28向国家知识产权局提交的专利申请。
本一种基于自适应编码的蛋白存储文件管理系统及方法在说明书摘要公布了:本发明揭示了一种基于自适应编码的蛋白存储文件管理系统及方法,包括编码记录数据库、解码记录数据库,信息编码模块、信息检索模块、信息解码模块和结果输出模块;信息编码模块用于将文件编码为氨基酸序列;信息检索模块用于查询编码记录和解码记录,根据编码记录得到编码文件地址用于后续的解码操作;信息解码模块用于将氨基酸序列解码为源文件;结果输出模块用于对编码和解码产生的结果进行输出。本发明提供的基于自适应编码的蛋白存储文件管理系统及方法,实现了具有存储密度高、测序覆盖率低、存储时间长、耦合度高、可塑性强的蛋白存储系统,保证数据存储的安全性、可靠性和持久性。
本发明授权一种基于自适应编码的蛋白存储文件管理系统及方法在权利要求书中公布了:1.一种自适应编码的蛋白存储文件管理方法,其特征在于,包括如下步骤: S100、预处理:将原始文件转换为二进制码; S200、加入冗余:在步骤S100中生成的二进制码中使用Reed-Solomon纠错码添加冗余信息; S300、分段:将添加完冗余信息的二进制码分割成等长的n个分段,在每个分段两端添加编号信息序列和可实现随机数据访问的信息序列,并基于RobustSoliton分布产生一个随机整数d; S400、自适应编码: 根据编码位置的特点,对上一步所获得编码中的有效载荷和非有效载荷两种不同情况采用不同的编码方式,其中,有效载荷指的是上一步所获得编码中未添加冗余之前的部分,非有效载荷是指分段时添加在每段两端的编号信息序列和可实现随机的数据访问的信息序列,其中,对于有效载荷部分进行编码包括以下步骤: S401、Luby变换:根据步骤S300中获得的d值,在n个分段中选出d个进行XOR异或运算生成编码符号,为了保障存储质量,引入两个字节的RS纠错码,然后将编码符号和纠错码组合成一个液滴,作为Luby变换的输出; S402、筛选:首先将液滴的二进制序列转换为氨基酸序列,然后运用算法对液滴的均聚物及GC含量进行筛选;若通过筛选,则认为液滴是有效的并将它添加至文件中进行存储,若未通过筛选,则认为是无效液滴,将其删除; S403、计算约束阈值:通过有效载荷编码的GC内容根据公式来自适应地计算非有效载荷编码时的GC含量阈值,使得在蛋白合成和测序中,GC的含量保持在50%,以获得更好的效果; 对于非有效载荷部分进行编码具体包括以下步骤: S404、计算有效载荷编码集的GC内容和连续性等特征值; S405、计算生成非有效载荷编码集GC内容的阈值、连续性阈值,针对不同的存储条件、存储内容、不同的实验环境和不同的存储开销,选择算法和约束; S406、输入对非有效载荷编码集合进行编码所需的地址位数,判断当前非有效载荷编码集GC内容的阈值条件是否超过非有效载荷编码集合的下界; S407、如果超过,则返回步骤S406,否则,执行步骤S408; S408、使用当前的非有效载荷编码阈值继续下一个编码过程 S500、蛋白合成:将步骤S400中生成的氨基酸序列合成为多肽链并制成蛋白信息存储材料; S600、信息解码:将氨基酸序列重新还原为原始文件; S700、结果展示:利用结果输出模块将步骤S600中生成的原始文件通过显示屏显示结果,并将结果保存至编码记录数据库中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海大学,其通讯地址为:200436 上海市宝山区上大路99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。