找回密码
 立即注册
相关推荐换一批
  1. JB/T 4730.3-2005 承压设备无损检测 第3部分 超声检测
  2. HG/T 2446-2005 胶辊 第5部分 造纸胶辊
  3. HG/T 3747.1-2004 橡塑铺地材料 第1部分 橡胶地板
  4. SY/T 5587.12-2004 常规修井作业规程 第12部分:打捞落物
  5. SY/T 5587.3-2004 常规修井作业规程 第3部分:油气井压井、替喷、诱喷
  6. SY/T 6150.1-2003 钢制管道封堵技术规程 第1部分:塞式、筒式封堵
  7. SY/T 5587.11-2004 常规修井作业规程 第11部分:钻铣封隔器、桥塞
  8. GB/T 16422.2-1999 塑料实验室光源暴露试验方法 第2部分:氙弧灯
  9. GB 13140.3-1998 家用和类似用途低压电路用的连接器件 第2部分:作为独立单元的带无?
  10. GB 13140.2-1998 家用和类似用途低压电路用的连接器件 第2部分:作为独立单元的带螺?
  11. GB/T 16284.6-1996 信息技术 文本通信 面向信报的文本交换系统 第6部分:协议规范
  12. GB/T 16273.6-2003 设备用图形符号 第6部分: 运输、车辆检测及装载机械通用符号
  13. GB/T 16273.5-2002 设备用图形符号 第5部分:塑料机械通用符号
  14. GB/T 16264.7-1996 信息技术 开放系统互连 目录 第7部分:选择客体类
  15. GB/T 16264.6-1996 信息技术 开放系统互连 目录 第6部分:选择属性类型
  16. GB/T 16264.5-1996 信息技术 开放系统互连 目录 第5部分:协议规范
  17. GB/T 16264.4-1996 信息技术 开放系统互连 目录 第4部分:分布式操作规程
  18. GB/T 16264.2-1996 信息技术 开放系统互连 目录 第2部分:模型
  19. GB/T 16264.1-1996 信息技术 开放系统互连 目录 第1部分:概念、模型和服务的概述
  20. GB/T 17969.6-2000 信息技术 开放系统互连 OSI 登记机构的操作规程 第6部分:应用进
  21. GB/T 17969.5-2000 信息技术 开放系统互连 OSI 登记机构的操作规程 第5部分:VT控制
  22. GB/T 17860.1-1999 电测量仪器 X-t 记录仪 第1部分:定义和要求
  23. 2021年部编版一年级语文上册《第一单元》培优练习试题考试卷及参考答案解析
  24. 2014-2015学年度小学一年级语文下学期期末学业水平检测卷考试卷
文件网站站上部分 | 软件设计/软件工程 2022-05-06 571 0star收藏 版权: . 保留作者信息 . 禁止商业使用 . 禁止修改作品
问题
我想抓取一个网站:h

我知道我必须使用:

file_get_contents

要获取网站的 html 部分,但如何在这样的文本文件中找到网站的特定部分:

<td title=”?????”title=”something”; class="txtclass="someclass">Tag namad>?????<Name</td>

当我打开文本文件时,我从来没有看到这部分,我认为是因为网站上有 javascript 文件。我怎样才能获得网站上的所有信息,包括我想要的每个部分?

回答
ajax 请求通过 javascript 加载的内容。这意味着您无法仅通过抓取页面内容来获取此数据。

收集数据有两种方式:

在您的特定情况下,可以使用以下 url:来访问包含所需数据的 json 对象。





上一篇:os.path.join 是否有替代 Pathlib?
下一篇:使用 Google Directions API 传输模式删除站点标记