什么是哈希值?对B站稿件撞车的判定机制有什么作用?

        搬运up主在B站上传视频时难免会出现稿件撞车的情况(在投稿该视频之前就已经有人上传过了),但是即使B站的判定机制如此严格,我们依旧能发现有许多视频的内容一模一样的。那B站的稿件撞车判定机制到底是什么呢?

        我带着这样的疑惑咨询了B站的在线客服。通过询问得知,B站的稿件审核主要是通过系统进行的,判断稿件是否撞车是不需要人为参与的。(另外如果稿件不慎撞车,是不会影响电磁力值的。)

        因此我特地尝试了一下投稿可能会撞车的视频。在投稿之前我已经通过搜索得知只有一个录屏版的视频和我即将要投稿的视频内容完全相同。结果过了一段时间后,审核通过了。没有出现撞车现象。

        通过上述的试验我们可以得知,B站审核系统是不会通过视频内容而判定你的视频是否与他人的视频撞车的。于是我们就可以顺理成章地判断,B站的稿件是通过视频文件来判断的——只要你的视频源文件和之前up主的源文件不一样,那么系统就不会认定你的稿件与之前up主的稿件撞车。而判断源文件是否相同的方法,就是HASH(哈希)算法

        这里简单给大家科普一下什么是哈希算法(百度百科的解释太术语了,这里给大家白话文一下)。哈希算法就像是人的指纹,是唯一的,世界上几乎不可能有两个不同文件的哈希值相同。我们常用的哈希算法有MD4、MD5和SHA-1,它们的应用主要有两个:一是校验文件的完整性,二是判断文件是否被人动过手脚。(其实本质都是比对两个文件是否相同)

        当我们从网上下载一个大文件时,往往会因为网络中断或者其它原因导致下载的文件损坏或不完整,这时候我们就可以通过计算哈希值(当然是用软件算了,比如“7-zip”)并与下载网站提供的文件哈希值进行比对,从而判断文件是否缺失或损坏。

        另外就是为了防止有人对官方(镜像)安装包进行二次编辑,向其中植入广告或病毒,这时候也是可以利用上述方法进行计算比对,从而判断安装文件是否被人动过手脚,避免自己的电脑“中招”。

        而B站的稿件撞车判定机制,利用的就是哈希算法,判断当前审核视频的哈希值是否与视频库中某条已通过审核视频的哈希值相同,从而判定是否撞车。我的视频之所以能够上传,是因为之前那位up主的视频是录屏得到的,而我的视频是从后台爬取的,两个视频的生成方式不一样,哈希值自然也就不一样啦~

        当然,随着科技的进步,审核的方式也在不断升级,所以获取优质的视频资源才是硬道理哦!

本文为我原创

本文禁止转载或摘编

-- --
  • 投诉或建议
评论