博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
简单的C#爬虫
阅读量:6836 次
发布时间:2019-06-26

本文共 2086 字,大约阅读时间需要 6 分钟。

using System;  using System.Collections.Generic;  using System.IO;  using System.Linq;  using System.Net;  using System.Text;  using System.Text.RegularExpressions;  using System.Threading.Tasks;    namespace _2015._5._23通过WebClient类发起请求并下载html  {      class Program      {          static void Main(string[] args)          {              #region 抓取网页邮箱              //string url = "http://zhidao.baidu.com/link?url=cvF0de2o9gkmk3zW2jY23TLEUs6wX-79E1DQVZG7qaBhEVT_xlh6TO7p0W4qwuAZ_InLymC_-mJBBcpdbzTeq_";              //WebClient wc = new WebClient();              //wc.Encoding = Encoding.UTF8;              //string str = wc.DownloadString(url);              //MatchCollection matchs=  Regex.Matches(str,@"\w+@([-\w])+([\.\w])+",RegexOptions.ECMAScript);              //foreach (Match item in matchs)              //{              //    Console.WriteLine(item.Value);              //}              //Console.WriteLine(matchs.Count);              #endregion                #region 抓取网页图片                //WebClient wc = new WebClient();              //wc.Encoding = Encoding.UTF8;              下载源网页代码              //string html = wc.DownloadString("http://dongxi.douban.com/?dcs=top-nav&dcm=douban");              //MatchCollection matches= Regex.Matches(html,"
"); //foreach (Match item in matches) //{ // //下载图片到指定路径 // wc.DownloadFile(item.Groups[1].Value,@"c:\mv\"+Path.GetFileName(item.Groups[1].Value)); //} //Console.WriteLine(matches.Count); #endregion 爬一些信息 WebClient wc = new WebClient(); wc.Encoding = Encoding.UTF8; string html = wc.DownloadString("http://www.lagou.com/"); MatchCollection matches= Regex.Matches(html,"
(.*)"); foreach (Match item in matches) { Console.WriteLine(item.Groups[1].Value); } Console.WriteLine(matches.Count); Console.ReadKey(); } } }

转载地址:http://bdhkl.baihongyu.com/

你可能感兴趣的文章
Putty添加SSH Key
查看>>
zuoye
查看>>
Oracle RAC 添加删除节点
查看>>
OU/Group/Group Policy组织单元、组和组策略
查看>>
菜鸟的DUBBO进击之路(二):Dubbo初识
查看>>
浏览器跑分测试
查看>>
Android的Activity屏幕切换动画(一)-左右滑动切换
查看>>
LVS+keeplived+nginx+tomcat高可用、高性能jsp集群
查看>>
Linux下清理内存和Cache方法
查看>>
XML1.1
查看>>
rhel6.3挂载HP-EVA6400磁阵--linux端操作流程
查看>>
Gradle构建脚本概要之构建块
查看>>
HashTable已经被淘汰了,不要在代码中再使用它
查看>>
ACCP学习旅程之----- 使用HTML语言开发商业站点(第一章 HTML的基本标签)
查看>>
AAD Connect 微软官方的描述准确吗?
查看>>
C++实现快速排序
查看>>
puppet 类、模块
查看>>
Rabbitmq安装
查看>>
2016年3月9日作业
查看>>
tomcat 部署站点时遇到的部分问题以及解决方案
查看>>