百度重内容,阿里重电商,腾讯重社交。从你有自己的网站那一刻起,就注定了未来和百度打交道,正如本文第一句话所讲:百度重内容。而且一而再再而三的告诉各位站长:提供有价值的内容给用户,会获得搜索引擎青睐。这也导致一直以来在站长圈都有这样一个观点:原创就会获得搜索引擎青睐。
可事实上并非如此。
在新一期百度站长平台发布的《网页搜索质量白皮书》中,”原创“两字仅出现了一次:
衡量网页质量的维度——内容质量:网页主题内容是网页的价值所在,百度要从以下角度评价网页内容质量:
①内容制作成本高低
②内容是否有效、完整丰富
③是否原创
④信息是否真实有效
⑤是否权威或投入较多专业的知识和经验
⑥是否存在作弊行为
看到了吧只有第三条、四个字,那么百度是如何判断原创的呢?无论是星火计划还是起源算法,都还是起步阶段,百度方面也承认:
识别原创解决原创问题确实面临着很大的挑战,计算数据规模庞大,面对的采集方式层出不穷,不同站点的建站方式和模版差异巨大,内容提取复杂等等问题。这些因素都会影响原创算法识别,甚至导致判断出错。这是摘自《百度给出了判断原创文章的方法,你们感受一下》一文,是官方的说法。
所以无论在白皮书中、还是在站长学院中,百度反复强调的是”高质量内容“而并非”原创“。虽然”原创“是衡量”高质量内容“最重要的一个指标,可无奈辨别能力有限,这也导致大站、历史悠久的站会被率先识别。