博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
解析 WEB 中所有 URL 的简单牛B代码,先保存起来,方式将来找不到了
阅读量:7057 次
发布时间:2019-06-28

本文共 1094 字,大约阅读时间需要 3 分钟。

using System;
using System.Collections.Generic;
using System.Linq;
using System.Web;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Net;
using Ivony.Fluent;
using Ivony.Web.Html;
using Ivony.Web.Html.Parser;
using Ivony.Web.Html.HtmlAgilityPackAdaptor;
using HtmlAgilityPack;
namespace Html解析
{
public
partial
class _Default : System.Web.UI.Page
   {
protected
void Page_Load(
object sender, EventArgs e)
       {
var client = 
new WebClient();
var html = client.DownloadString(
"
http://www.cnblogs.com/
");
var parser = 
new JumonyParser();
var document = parser.Parse(html);
var links = document.Find(
"
a[href]
");
var baseUrl = 
new Uri(
"
http://www.cnblogs.com
");
var data = 
from hyperLink 
in links
                      let url = 
new Uri(baseUrl, hyperLink.Attribute(
"
href
").Value())
orderby url.AbsoluteUri
select
new
                      {
                          Url = url.AbsoluteUri,
                          IsLinkingOut = !url.Host.EndsWith(
"
cnblogs.com
"),
                          Target = hyperLink.Attribute(
"
target
").Value() ?? 
"
_self
"
                      };
           GridView1.DataSource = data;
           GridView1.DataBind();
       }
   }
}
本文转自 jirigala 51CTO博客,原文链接:http://blog.51cto.com/2347979/1197289,如需转载请自行联系原作者
你可能感兴趣的文章
麦进斗:magento如何安装子主题
查看>>
Stack Based Windows Buffer Overflow Tutorial
查看>>
单双链表,通过指针变动交换相邻元素
查看>>
redhat中设置环境变量PATH的方法
查看>>
在bootstrap的modal中使用popover和tooltip
查看>>
linux系统下搭建squid服务
查看>>
2013-7-18学习作业[有常考面试题]
查看>>
ant工具的使用和功能
查看>>
Linux 常用系统工具与初始化配置
查看>>
31、C#里面的图片框PictureBox的使用
查看>>
CCNP学习笔记9——OSPF
查看>>
Java applet 安全性探究
查看>>
nocloud开发随记-2011-11-20
查看>>
Linux系统编程 --- 共享内存及内存映射【十全十美】
查看>>
如何创建一个swap文件
查看>>
mysql联合索引
查看>>
linux文本操作之---sed
查看>>
htmlcleaner 使用示例
查看>>
XenServer中创建多块网卡的绑定
查看>>
我的友情链接
查看>>