python网络爬虫(零)——认识网页结构

admin2024-09-05  15

  网页一般有三部分组成,分别是HTML(超文本标记语言)、CSS(层叠样式表)、JScript(活动脚本语言)

1.HTML

  HTML是整个网页的结构,相当于整个网站的框架。带“<”“>”符号都属于HTML的标签,并且标签都是成对出现的。

语法内容
html网页
body内容
div框架
p段落
li列表
hi标题
a href超链接

  一个简单的html代码如下:

<html>
<head>
<title>python3爬虫与数据清洗入门</title>
</head>
<body>
<div>
<p>python3爬虫与数据清洗入门</p>
</div>
<ul>
<li><a href="http://www.baidu.com">爬虫</a></li>
<li>数据清洗</li>
</ul>
</div>
</body>
</html>

  程序执行效果如下:
python网络爬虫(零)——认识网页结构,在这里插入图片描述,第1张

2.CSS

  CSS表示样式,表示将在下面引用一个CSS,并在CSS中定义了对应的样式。

3. JScript

  JScript表示功能,交互的内容和各种特效都在JScript,JScript描述了网站中的各种功能。
  如果把网页比喻为人体,那么html就是人的骨架,并且定义了人的五官;CSS表示人的外观细节,即五官长什么样子,JScript表示人的技能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明原文出处。如若内容造成侵权/违法违规/事实不符,请联系SD编程学习网:675289112@qq.com进行投诉反馈,一经查实,立即删除!