我们的生活有这么多的障碍,真他妈的有意思,这种逻辑就叫做黑色幽默。

成功解除GOOGLE恶意软件提示

很早的时候我去StopBadware.org这个网站请求重新审核商都网,原因是在GOOGLE的搜索结果中,商都网的条目都被列出了恶意软件的提示。今天早上在公交车上,我用手机看我信箱,发现StopBadware.org来信了,说经过重新审核,已经解除了GOOGLE恶意软件的提示.相关文章请看这里:

如何去除Google恶意软件警告提示

信的原文如下:

font-family: 宋体;">We have received and processed your request for review of your website, shangdu.com/.
 Google's most recent test of your website found no badware behaviors on the site.
 As such, the Google warning page for your site has either already been removed or
should be removed shortly.  In addition, if your site has been listed in our Badware
Website Clearinghouse, we will remove your site from the Clearinghouse list.

Sometimes website owners are confused about why Google placed a warning in the
search results for their site.  In many cases, a website run by an innocent
site owner has been hacked by a malicious third party, causing the site to
 distribute badware without the site owner's knowledge.  If your site was
 distributing badware because it has been hacked, then simply removing the
bad code from your site is not enough to keep your site clean in the future.
 You will also need to work with your hosting provider to fix all security
 vulnerabilities associated with your site.

Please note that we will be retesting your website at periodic intervals
in order to monitor that it remains free from badware.  If we find that
you are hosting or distributing badware in the future, the reviews
process may take considerably longer than the original review.

Answers to commonly asked questions from site owners who are the s
ubject of Google warnings can be found at:  http://stopbadware.org/home/faq#partnerwarnings
For tips on keeping your website clean and secure, please visit:
http://stopbadware.org/home/security

The StopBadware Team

要注意的是

Please note that we will be retesting your website at periodic
intervals in order to monitor that it remains free from badware.
If we find that you are hosting or distributing badware in the
future, the reviews process may take considerably longer than
 the original review.
这句话,大意思是说,我们会定期检查你的站,
如果再发现你们散步恶意软件被我们抓住,我们对你们提出的解除请求的审查过程将会非常非常漫长。

我当时盯着这句出神,一直到花卉市场才反应过来。拐回公司花了我二十分钟时间。

theboy @ 五月 20, 2008 at 13:34 下午

google开车,百度骑牛

博客的页面,新发表后GOOGLE十分钟内就收录了,一般都是在一分钟内。而百度要近20天才收录。

昨天百度收录我的页面还只是10页,今天变成68页,这在我意料之中。SITE出来的页面显示的日期全是3.30号左右的,百度早就索引了,就是不放出来,百度近一个月的的考察期马上就要结束,我站也快转正了。哈哈。百度小样,看怎么玩你。

theboy @ 四月 17, 2008 at 22:42 下午

蜘蛛成精啦–Googlebot开始检索网站深层内容 自动填写表单

Google公司今天宣布,其Googlebot web信息采集系统将开始自动填写HTML表单,并记录反馈结果。

Google搜索引擎似乎在不顾一切的吞食来自互联网的数据,仅去年1年它就吞下了约100 Exabytes(1 Exabyte=1000000000 Gigabyte)的数据。
之前Google并不触及大量的深层页面(也就是网站中被隐藏的内容,例如没有连接的页面,非文本的内容,或是动态内容返回的结果),但是从今天开始,Google将开始对这些页面进行检索。

据Google表示“对于文本框,我们的电脑会自动对网站上的表格进行填写,并会选择菜单,复选框,以及相应的按钮,然后索引有价值的HTML 结果。”Google指出,对于动态表格所反馈的结果并不影响对网站的普通检索,排名或是其他的内容。并且Googlebot绝对会遵守 robots.txt的规定不对禁止访问机器人访问的页面进行检索。

据估计,目前互联网上的深层页面要比目前公布的页面大几个数量级。而且有人指出,Google永远也不能把互联网上的所有内容都检索到,其 Googlebot的爬行结果对于整个互联网来说只是管中窥豹。不过Google表示,对深层页面的索引只是为了找出更多动态页面之间的联系,而不仅仅是为了索引结果。

theboy @ 四月 14, 2008 at 22:08 下午

google如何处理原创内容

昨天看了一篇文章,作者为seo中的大腕儿,文章的意思是google现在通过加快对新页面的抓取,来分辨谁是原创者,谁是抄袭者。作者还分析了以前google不好分辨谁是原创的原因,说现在google通过加快对新页面的收录来判断这问题。
这想法我不敢苟同,首先作者忽略了一个很重要的问题,那就是服务器所在地不同和网站程序问题,对蜘蛛来说,服务器所在地的不同也造成一定的收录时间差,“先发者”为未必先收录。另外,关于加快收录问题其实去年我已经发现,sukiblog一般都在发表后十分钟内收录,一是因为服务器在美国洛杉矶,二是因为用的是blog程序wordpress,我又给wordpress做过这些优化。大家都知道搜索引擎对blog有特殊的权重,同时服务器在美国,所以去年我抄很多别的站的内容时收录也是一样的快。我完全可以复制一些google还没及时收录的别的站的原创内容发我blog上,然后十分钟收录,可能会先于原站收录,但是这并不能说我是原创,只是钻了空子而已。
所以说,google加快对新页面的收录是真的,但是说google把这当作判断谁是原创的一个重要方法,那就未免太小看google啦。

theboy @ 四月 3, 2008 at 7:32 上午

诡异的GOOGLE

        我blog,前几天google已经收录,昨天SITE的时候已经没有结果。然后我就去DIGG了一下,结果今天又收录了,但是收录结果很奇怪,收了我一个页面,而且不是主页,是我DIGG的那个页面。qijuzhugoogle.jpg
google不知道为什么不收录我。最近google有些奇怪。但是digg的力量是无穷大的。基本上可以影响google的搜索结果。文化频道收录无望。原因是框架太多,js太多,而且主页还是跳转的,我真算了服了。也许是我技术不行,标题竟然还有

qijuzhutitle.jpg

这样的写法。页面最基础的东西乱的要死,基本上是搜索引擎不支持什么就写什么,蜘蛛估计是不会来捉我们文化频道的啦。

theboy @ 三月 26, 2008 at 0:12 上午