使用lxml解析xml_iteye_19224的博客-程序员宅基地

技术标签: C#  C++  C  OS  XML  


#coding:gb2312
import os
import lxml
import lxml.etree,StringIO
import lxml.html as x

if __name__ == '__main__':
filelist = os.listdir("/backup/ksearch/query/videos/youku_new/info/")
for filename in filelist:
filepath = "/backup/ksearch/query/videos/youku_new/info/" + filename
f= open(filepath, "r")
c=f.read()
doc=lxml.etree.parse(StringIO.StringIO(c))
alist=doc.xpath("/Videos/Video/wid")
print len(alist)
for a in alist:
print a.text

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/iteye_19224/article/details/81759198

智能推荐

linux 查看系统组账号密码是什么,Linux 用户与组管理详解(system-config-users && 命令行)..._民科心中的物理的博客-程序员宅基地

用户与组管理什么是用户,用户是人吗?用户是干啥的?用户账号超级管理员: root普通用户: ruochen系统/程序用户: 系统中为某个程序而产生的用户,这类用户一般不允许登录操作系统组账号定义: 用户的集合基本组: 与用户同名的一个组附加组: 将其他用户增加到某个组中,那么这个组称为其他用户的附加组用户作用Linux 基于用户身份对资源进行访问控制UID 和 GID 号uid(user iden...

Python·Jupyter Notebook各种使用方法记录_帝熙无痕的博客-程序员宅基地

摘要:Python·JupyterNotebook各种使用方法记录PythonJupyterNotebook各种使用方法记录一JupyterNoteBook的安装1新版本Anaconda自带Jupyter2老版本Anacodna需自己安装Jupyter二更改Jupyternotebook的工作空间1Jupyter的工作空间在哪里指定2如何找到该配置文件三Jupyter的各种快捷键四JupyterN...

testufo测试刷新率测试_数字里的秘密,144Hz和60Hz刷新率的区别_BinglunGe的博客-程序员宅基地

原标题:数字里的秘密,144Hz和60Hz刷新率的区别今年随着吃鸡游戏的大火,显示器在宣传了多年的144Hz电竞专属刷新率之后,终于进入到了市场接受的地步。大家对144Hz的认可,主要来自去年的一场电竞比赛,参赛选手到了现场发现显示器是60Hz的,马上要求换144Hz,否则影响“国外”选手的发挥。 好吧。为了不影响“国外”选手,当时的硬件提供商确实进行了更换,但是报道此事的编辑继续说:大部分的肉眼...

解决redis-cli连接时出现Could not connect to Redis at 127.0.0.1:6379: Connection refused_YhdHuaidong的博客-程序员宅基地

解决redis-cli连接时出现Could not connect to Redis at 127.0.0.1:6379: Connection refused执行redis 配置文件redis-server /etc/redis/redis.conf就命令执行成功之后OK!!!!...

suse linux密码策略,请教关于suse 11与suse 9密码复杂度配置的问题_宇宙探索未解之迷的博客-程序员宅基地

大家好:我按照以下在suse9上面配置密码复杂度的方法配置suse11的密码复杂度:(1)、配置/etc/security/pam_pwcheck.conf文件备份:cp/etc/security/pam_pwcheck.conf/etc/security/pam_pwcheck.conf.bak编辑:vi/etc/security/pam_pwcheck.conf将password:...

html盒子模型 正方形嵌套,CSS盒子模型的内部结构_张雪鹏的博客-程序员宅基地

CSS 3中,所有的页面元素都包含在一个矩形框内,称为盒子。盒子描述了元素及其属性在页面布局中所占的空间大小。在页面设计中有4个常见属性:content(内容)、padding(内边距)、border(边框)和margin(外边距),我们把这4部分转化成日常生活的盒子来理解,所以称为盒子模型。content(内容)就是盒子里装的东西,padding(内边距)就是怕盒子里装的东西损坏而添加的泡沫或者...

随便推点

我的世界服务器精灵模型文件在哪,[娱乐|机制]PokemonInfo — GUI界面查看精灵信息 , 精灵变照片[1.12.2] - 服务端插件 - Minecraft(我的世界)中文论坛 -..._吞饭小丸子的博客-程序员宅基地

老板还报错[23:05:03] [Server thread/INFO]: [PokemonInfo] Disabling PokemonInfo v1.1[23:05:06] [Server thread/INFO]: [PlugMan] PokemonInfo has been unloaded.>plugman load PokemonInfo[23:05:16] [Server th...

linux编译qt4.8.6,Centos6.6 安装 Qt4.8.6 + QtCreator2.6.1_七231fsda月mkq的博客-程序员宅基地

1.安装包http://download.qt.io/official_releases/qt/4.8/4.8.6/http://download.qt.io/official_releases/qtcreator/2.6/2.6.1/因为我的操作系统是64位的,所以安装的64位版本。2.安装 QtCreator2.6.1(1)在文件同目录,首先chmod 777qt-creator-linux...

为什么我的u盘计算机无法识别u盘启动,电脑无法识别u盘怎么办 无法读取u盘解决方法..._盐选成长计划的博客-程序员宅基地

大家在使用电脑时会经常遇到U盘无法读取,u盘无法识别。一般由以下故障超成的:1.U盘本身故障,如果U盘坏了,肯定读不出来了;这种问题,我们可以换个电脑,或者别的USB可以用,但U盘插上却无任何反应,那么基本可能是U盘故障了。2.电脑USB接口不良,超成无法识别的电脑;这种问题,我们可以换一个USB接口试试,或者换台电脑就可以知道是否是接口问题了,当然除了接口问题,还可能是关闭了USB功能,详情看第...

饥荒显示服务器未响应是什么意思,微软或将在本周内推送Win10 10586.71累积更新(图)..._股海重生的博客-程序员宅基地

原标题:"微软或将在本周内推送Win10 10586.71累积更新"相关电脑问题教程分享。 - 来源:路由器之家。不久前,微软更新服务器上出现了Win10 Mobile 10586.71的身影。现在亲,以下就是关于(微软或将在本周内推送Win10 10586.71累积更新(图)),由“路由器之家”整理!原标题:"微软或将在本周内推送Win10 10586.71累积更新"相关电脑问题教程分享。 - ...

js随机生成姓名及数组去重_weixin_33877885的博客-程序员宅基地

// 数组去重Array.prototype.removeDup = function() {var result = [];var obj = {};for (var i = 0; i < this.length; i++) { if (!obj[this[i]]) { result.push(this[i]); obj[this[i]]...

sqlserver2008r2通过发布和订阅的方式进行数据库同步_weixin_33895475的博客-程序员宅基地

发布服务器:192.168.8.16订阅服务器:192.168.8.92发布服务器配置:选择需要发布的数据库,这里是Attendace_new订阅服务器配置:在订阅服务器上新建一个数据库:dbpublish查看运行状态: 转载于:h...

推荐文章

热门文章

相关标签