绿兔子 发表于 2020-4-13 01:05:34

论文去重小助手

2020-04-09 15:00更新
[*]由于我的两百万字符一下子用光,所以部分用户出现了闪退等异常。我就临时删除了资源。现在更新了
[*]新增了自定义appid和密钥功能。请大家在百度翻译开放平台申请账号,实名认证即可获取高级版。将高级版appid和密钥填入小工具即可!
[*]不输入自己的appid和密钥,可能会出现异常!因为调用我的appid的人太多了!
[*]谢谢大家的耐心等待!更新日志
[*]按照论坛规定,已去除邮箱。反馈请在此帖内回复。谢谢管理员提醒。去重原理
原理很简单:通过不断地在多种语言之间翻译,最终翻回中文。由于各国语言习惯不同,最终翻译出来的文字,在进行简单调整之后,就达到去重的效果。后文有效果对比。具体地:
去重等级去重原理
初级中->英->德->中
中级中->英->德->日->葡萄牙->中
高级中->英->德->日->葡萄牙->意大利->波兰->保加利亚->爱沙尼亚->中

[*]软件声明

[*]本工具完全免费。

[*]请勿用于商业用途,转载请注明出处。谢谢!

实现代码由于代码中包含个人appid(使用的是百度翻译api),不便开源。只将translate()方法实现代码贴出。软件安全无毒,请放心使用。def translate(words, from_lang, to_lang):    salt = random.randint(32768, 65536)    sign = appid + words + str(salt) + appseceret    sign = hashlib.md5(sign.encode()).hexdigest()    # 这里是为了支持换行    q = {'q': words}    q = urlencode(q)    words = q.split('q=')[1]    myUrl = base_url + '?q=%s&from=%s&to=%s&appid=%s&salt=%s&sign=%s' % \            (words, from_lang, to_lang, appid, salt, sign)    content = parse(myUrl)    return content去重效果测试复制某论文中的一段文字:随着信息技术的普及和推广,计算机网络已经成为生活和工作必不可少的有力工具。对于学校而言,实现办公自动化将大大提高学校管理的工作效率。学生成绩管理系统对于学校实现办公自动化将起到重要作用。本学生成绩管理系统是基于web开发完成的,采用了SSM作为网络编程框架,选择MySQL5.1设计数据库,使用MyEclipse进行开发,能良好的支持数据库应用。本系统主要实现对学生成绩的管理,包括用户管理,学生成绩查询,学生成绩的录入、删除、统计等方面。系统开发主要包括建立和维护后台数据库以及前端应用两个方面。本文主要介绍学生成绩管理系统的可行性分析、需求分析、系统设计和系统实现等。
[*]将上述段落存入“版本1.docx”。使用查重工具(论坛中有免费的查重工具,这里用的就是)
[*]结论可以看到,版本2的重复率为14.34%,原来的文字重复率为100%。经过中级去重,重复率整整降低了85.66%!两款工具配合使用,针对重复率高的段落,进行智能去重,丝毫不担心重复率了。下载地址屌丝土豪一视同仁通道:https://www.lanzous.com/ib5pcsb

芊芊551 发表于 2020-4-13 01:06:36

大人,此事必有蹊跷!

贰十岁装成熟装s 发表于 2020-4-13 01:06:42

沙发抢不到,板凳也行啊!

形腿望舞 发表于 2020-4-13 20:01:15

白云追月素 发表于 2020-4-16 11:17:22

不错,顶一个!
页: [1]
查看完整版本: 论文去重小助手