QA黑手党开展了一系列的编程活动,本系列将收集整理其中的一些

– https://github.com/chenkan/BlackQA/tree/master/codes

– https://github.com/chenkan/BlackQA/issues

+++++++++++++++++++++ 以下正文 ++++++++++++++++++++++

知识点

1. 字符编码处理

2. 正则表达式

3. 字符串处理

4. Github使用

要求及步骤

1. 获取一个指定URL(www.163.com)的页面内容(须处理好中文字符,不允许乱码)

2. 提取页面上所有形如”xxx.163.com”字符串(不包括”xxx.yyy.163.com”)

3. 对这些字符串进行去重/排序/格式化输出

4. 提交源码(不包括依赖的库文件)及一份格式化输出至Github

编程语言

不限,推荐:Shell/Ruby/Python

本题来源

https://github.com/chenkan/BlackQA/blob/master/codes/2013_03_04/game.rb

One thought on “QA黑手党编程游戏[1] – 网页抓取及处理”

发表评论

电子邮件地址不会被公开。 必填项已用*标注