$r;$i++)>$r;$i++)>$r;$i++)>0)>
The Hong Kong Polytechnic University
Department of Computing
Data Mining and Data Warehousing
Assignment 1
Due: October 3, 2006
Department of Computing
Data Mining and Data Warehousing
Assignment 1
Due: October 3, 2006
感谢朋友们发现GSitemap中关于对http头信息分析遗漏的问题,更新了头信息分析代码和url处理代码。更正结果:能够处理url重定向头信息;改善url的过滤,将遗漏页面加入搜索列表。
下载页面和以前相同。
下载页面和以前相同。
在以前几个版本的基础上,特别是Google Sitemap for Bo-Blog插件的开发,独立版本的PHP GSitemap Crawler终于出来了。该版本相对于Bo-Blog插件只是改进一些界面效果,结构化了代码块,并将创建数据库部分独立出来。希望对大家有用。可以看看本站的DEMO。
下载独立版本安装文件
PS:感谢天涯告知关于其发现的mysql版本问题,建议php版本大于4.1,mysql版本大于4.1。
下载独立版本安装文件
PS:感谢天涯告知关于其发现的mysql版本问题,建议php版本大于4.1,mysql版本大于4.1。
发现上传sitemap时出现parse error,检查下载部分代码,找出错误的地方是关于最终生成xml文件中地址时忘了加htmlentities函数。添加htmlentities函数,并修改了一些细节处理部分,通过google的测试。重新发布了zip包。之后准备发布独立于bo-blog的版本。文件下载还在先前POST中。
在网上看了很多收费和免费Google Sitemap生成器,觉得其实原理很简单,但是麻烦的是自动定时执行。用perl试着写了一个,从perl入手是因为看中它强大的字符处理能力。但是最后还是放弃了。因为它的数组函数不是很好。于是改用PHP。PHP有几个限制,一个是处理时间。大多数服务器制定给PHP执行的时间不会太长。第二个是模式匹配问题。preg类函数需要编译时加选项。不过所幸的是第一个问题可以通过修改程序流程解决。第二个问题只能通过已有的字符函数加上PHP本身强大的数组处理函数来弥补。由于写得匆忙,还有很多bug。大家遇到的话,麻烦留言给我。
插件安装很简单,解压上传文件夹到plugin文件夹下。到外观扩展->插件管理->安装插件,输入sitemap。
安装好了以后,到外观扩展->插件管理->sitemap->管理。程序开始扫描你的网站,等一会儿(时间要看你网站的大小),等到CRAWL URL QUEUE数量为零的时候,可以看到最下面有提供sitemap.xml或者sitemap.xml.gz下载的连接。下载后上传到你的相应目录即可。
注意:
config.php里是基本的配置,$url_filter是指那些路径不需要搜索,$file_filter是指出那些文件类型不需要搜索。但是考虑到有些特殊的连接是以文件名结尾却打开是个文件的情况,也有考虑。define的MAXSESSION是指有多少个线程同时搜索。
如果你不知道什么是Google Sitemap或者不知道如何申请等等,非针对本插件的问题,本人恕难奉告,请自己查阅Google网站。
下载插件
插件安装很简单,解压上传文件夹到plugin文件夹下。到外观扩展->插件管理->安装插件,输入sitemap。
安装好了以后,到外观扩展->插件管理->sitemap->管理。程序开始扫描你的网站,等一会儿(时间要看你网站的大小),等到CRAWL URL QUEUE数量为零的时候,可以看到最下面有提供sitemap.xml或者sitemap.xml.gz下载的连接。下载后上传到你的相应目录即可。
注意:
config.php里是基本的配置,$url_filter是指那些路径不需要搜索,$file_filter是指出那些文件类型不需要搜索。但是考虑到有些特殊的连接是以文件名结尾却打开是个文件的情况,也有考虑。define的MAXSESSION是指有多少个线程同时搜索。
如果你不知道什么是Google Sitemap或者不知道如何申请等等,非针对本插件的问题,本人恕难奉告,请自己查阅Google网站。
下载插件
很多人问我的侧边栏音乐插件。其实是nuonuo的那个flash好看,因为自己比较笨,所以只能偷来用用了。而且这个侧边栏没有什么技术含量,我本来想将就着用,等有空了做成可以在后台添加删除歌曲的插件。现在只好把它导成blog文件,献给大家解解馋。
安装步骤:
1、下载zip文件解压上传到服务器plugin目录下。
2、在后台管理->常规管理->模块配置->新增/编辑项目中输入插件所在目录,比如(songs),确定
3、进入后台管理->常规管理->模块配置->侧边模块,选择Music模块的编辑,根据你自己网站信息修改栏目内容代码中http://www.mydigitallife.org.uk/plugin/songs/部分。如果你够懒的话,不修改也行,就是用本网站歌曲。
4、配置config.xml和playlist.xml,方法去http://www.jeroenwijering.com/?item=Flash_MP3_Player看看。其实打开zip包里文件,照着写也不会有错。
<embed style="WIDTH: 200px; HEIGHT: 120px" src="plugin/songs/yearn.swf" width="200" height="120" type="application/x-shockwave-flash" />
<object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="200" height="85" id="mp3player"
codebase="http://fpdownload.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=8,0,0,0">
<param name="movie" value="/plugin/songs/mp3player.swf?config=http://www.mydigitallife.org.uk/plugin/songs/config.xml&file=http://www.mydigitallife.org.uk/plugin/songs/playlist.xml" />
<param name="wmode" value="transparent" />
<embed src="/plugin/songs/mp3player.swf?config=http://www.mydigitallife.org.uk/plugin/songs/config.xml&file=http://www.mydigitallife.org.uk/plugin/songs/playlist.xml" wmode="transparent" width="200" height="85" name="mp3player"
type="application/x-shockwave-flash" pluginspage="http://www.macromedia.com/go/getflashplayer" />
</object>
插件下载
安装步骤:
1、下载zip文件解压上传到服务器plugin目录下。
2、在后台管理->常规管理->模块配置->新增/编辑项目中输入插件所在目录,比如(songs),确定
3、进入后台管理->常规管理->模块配置->侧边模块,选择Music模块的编辑,根据你自己网站信息修改栏目内容代码中http://www.mydigitallife.org.uk/plugin/songs/部分。如果你够懒的话,不修改也行,就是用本网站歌曲。
4、配置config.xml和playlist.xml,方法去http://www.jeroenwijering.com/?item=Flash_MP3_Player看看。其实打开zip包里文件,照着写也不会有错。
<embed style="WIDTH: 200px; HEIGHT: 120px" src="plugin/songs/yearn.swf" width="200" height="120" type="application/x-shockwave-flash" />
<object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="200" height="85" id="mp3player"
codebase="http://fpdownload.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=8,0,0,0">
<param name="movie" value="/plugin/songs/mp3player.swf?config=http://www.mydigitallife.org.uk/plugin/songs/config.xml&file=http://www.mydigitallife.org.uk/plugin/songs/playlist.xml" />
<param name="wmode" value="transparent" />
<embed src="/plugin/songs/mp3player.swf?config=http://www.mydigitallife.org.uk/plugin/songs/config.xml&file=http://www.mydigitallife.org.uk/plugin/songs/playlist.xml" wmode="transparent" width="200" height="85" name="mp3player"
type="application/x-shockwave-flash" pluginspage="http://www.macromedia.com/go/getflashplayer" />
</object>
插件下载
由于一直没有很好的音乐插件,所以在看到FLAM Player1.5的时候如获至宝。但是因为是基于数据库和FLASH的。改造起来蛮麻烦的,所以研究了好半天才看懂个大概。不好意思人比较笨。由于时间匆忙,两天赶了个大概框架出来。算是beta版吧。因为之前有个文本数据库版本的测试,所以算它是0.10beta。本人技术有限,美术功底很烂。所以附上FLAM Player1.5代码供大家参考和修改。我的东西只是抛砖引玉。废话不多说了,下载了试试看。
MUSICBOX0.10beta
FLAM Player1.5
MUSICBOX0.10beta
FLAM Player1.5
在上传文件时,看到服务器上有个文件夹命名为error_docs里面放的是主要的网络浏览出错页面。由于是服务商提供的免费页面,很丑陋。于是自己定义了出错页面,并结合blog搜索功能。鉴于自己有多个域名,还需要结合.htaccess文件配置。下面是测试链接和相关信息。
HTTP 403 File Forbidden
HTTP 404 File Not Found
.htaccess增加的配置:(注意:其中的路径名不可和系统默认使用的路径同名)
出错页面shtml文件下载
HTTP 403 File Forbidden
HTTP 404 File Not Found
.htaccess增加的配置:(注意:其中的路径名不可和系统默认使用的路径同名)
ErrorDocument 400 /errors/bad_request.shtml
ErrorDocument 401 /errors/unauthorized.shtml
ErrorDocument 403 /errors/forbidden.shtml
ErrorDocument 404 /errors/not_found.shtml
ErrorDocument 500 /errors/internal_server_error.shtml
ErrorDocument 401 /errors/unauthorized.shtml
ErrorDocument 403 /errors/forbidden.shtml
ErrorDocument 404 /errors/not_found.shtml
ErrorDocument 500 /errors/internal_server_error.shtml
出错页面shtml文件下载





October 4, 2006 @ 12:52,


