用http代理下载sourceforge的cvs仓库[原理 c#代…
2008-02-23 05:41:50来源:互联网 阅读 ()
12月的地震震断了几根光缆,麻烦的事情接踵而至,直连sourceforge上不去了,只好用代理。虽然能够下载到打包好的代码,但某些代码已显得陈旧,而cvs最新的代码确要用工具checkout,但很郁闷的事情cvs不支持http代理。有一下一些解决办法:
1、找sockets代理,然后用eborder等软件使cvs能够用。明显,网络上提供sockets代理的少之又少。
2、通过工具把http代理变成sockets代理。当然此法能够行得通,但cvs checkout的速度慢的惊人,没有可行性。
3、找联通的网络,他们出国没有受到损坏,速度很快。
4、等待网络修好:)
5、另:感谢A.E告诉我eclipse也能够支持!
……
由于急需一些开源项目的cvs代码,以上途径又不太现实,所以还是另想办法。
但令人高兴的是,我能够用http代理通过浏览器查看sourceforge的ViewVC工具所提供的cvs代码,这给我了很大的启发,准备利用 ViewVC来下载源代码。随后就分析ViewVC生成的页面,我们这里以lib3ds.cvs.sourceforge.net作为例子。
打开页面以后呈现在面前的是个目录结构,点击进入下一层目录,能够看到ViewVC为我们输出了目录和文档。每一个目录和文档都有一个超链接,假如单击目录的话会进入下一层目录,而点击文档会进入文档的周详说明(例http: //lib3ds.cvs.sourceforge.net/lib3ds/lib3ds/3ds-utils.spec.in?view=log),包括CVS Tags等等。
在http://lib3ds.cvs.sourceforge.net/lib3ds/lib3ds/3ds-utils.spec.in?view=log 页面里,会发现有一个download超链接,这个超链接能够让我们下载到这个文档,点击这个文档以后,地址栏会变为:http: //lib3ds.cvs.sourceforge.net/*checkout*/lib3ds/lib3ds/3ds-utils.spec.in?revision =1.1,文档的周详内容也在眼前了,这就是我们需要的源代码。
请注意地址里面的/*checkout*/,这将是我们的入手点,只要找到文档的相对路径,我们在前面加上/*checkout*/就能够下载这个文档了。而后面的参数能够忽略,默认会得到最新的版本。
很好,下一步就是分析如何得到相对地址。由于ViewVC工具生成的网页代码很有规律,一个目录的超链接类似于:
<a name="examples" href="/lib3ds/lib3ds/examples/" title="View directory contents">
而一个文档的超链接类似于:
<a href="/lib3ds/lib3ds/lib3ds/viewport.h?revision=1.6&view=markup" title="View file contents">
和<a href="/*checkout*/lib3ds/lib3ds/autogen.sh?revision=1.14" title="Download file contents">
只需要通过正则表达式就能够把地址抓出来,剩下的工作应该知道了吧:)
我做了一个小小的程式来实现最基本的功能,对于更多的功能,比如更多的错误恢复、多线程下载等等请自己实现。
VS2005演示工程和下载地址:http://www.hesicong.net/aspx/fileuploader/Upload/Internet_ViewVC_CVS_Checkout.rar
最后不要忘了到我的个人主页来凑个热闹哦http://www.hesicong.net
下面是完整的源代码,在VS2005下编译运行成功。
using System;
using System.Collections.Generic;
using System.Text;
using System.Net;
using System.IO;
using System.Text.RegularExpressions;
namespace Internet_ViewVC_CVS_Checkout
{
/// <summary>
/// A simple ViewVC CVS checkout class
/// Author: hesicong
/// Homepage: www.hesicong.net hesicong.cnblogs.com
/// </summary>
public class ViewVC_CVS_Checkout
{
public static Regex regFindDir = new Regex(
@"href=""(?<DIRURL>.*)?""\s*title=""View\sdirectory\scontents"">",
RegexOptions.IgnoreCase
| RegexOptions.CultureInvariant
| RegexOptions.IgnorePatternWhitespace
| RegexOptions.Compiled
);
public static Regex regFindFiles = new Regex(
@"href=""(?<FILEURL>.*)?\?(.*)""\s*title=""(View|Download)\sfi"
@"le\scontents"">",
RegexOptions.IgnoreCase
| RegexOptions.CultureInvariant
| RegexOptions.IgnorePatternWhitespace
| RegexOptions.Compiled
);
public class DirList
{
public List<DirList> dir;
public List<string> file;
};
static string store;
static WebClient wc = new WebClient();
static WebClient wcFileDown = new WebClient();
public static void Main()
{
Console.ForegroundColor = ConsoleColor.White;
WebProxy proxy = new WebProxy();
Console.WriteLine("======================================================================");
Console.WriteLine(" ViewVC CVS Checkout ");
Console.WriteLine(" Author:hesicong Homepage:www.hesicong.net hesicong.cnblogs.com ");
Console.WriteLine("======================================================================");
Console.Write("Enter your Proxy:(IP:PORT): ");
proxy.Address = new Uri("HTTP://" Console.ReadLine());
Console.Write(@"ViewVC Start URL:(HTTP:///): ");
wc.BaseAddress = Console.ReadLine();
Console.Write(@"Where to store your files? (Driver:\Dir): ");
store = Console.ReadLine();
wcFileDown.Proxy = proxy;
wc.Proxy = proxy;
Console.WriteLine("Start downloading");
DirList dl;
dl = getTree("/");
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash