0
我想刮掉treasury.gov网站上的每个国库券收益率。Python从网站刮表?
我怎么会去考虑这些信息?我假设我不得不使用BeautifulSoup或Selenium或类似的东西(最好是BS4)。我最终想将这些数据放入Pandas DataFrame中。
我想刮掉treasury.gov网站上的每个国库券收益率。Python从网站刮表?
我怎么会去考虑这些信息?我假设我不得不使用BeautifulSoup或Selenium或类似的东西(最好是BS4)。我最终想将这些数据放入Pandas DataFrame中。
这里有一种方法可以使用请求获取数据以表格和beautifulsoup
import pandas as pd
import requests
from bs4 import BeautifulSoup
url = 'https://www.treasury.gov/resource-center/data-chart-center/interest-rates/Pages/TextView.aspx?data=yieldAll'
r = requests.get(url)
html = r.text
soup = BeautifulSoup(html)
table = soup.find('table', {"class": "t-chart"})
rows = table.find_all('tr')
data = []
for row in rows[1:]:
cols = row.find_all('td')
cols = [ele.text.strip() for ele in cols]
data.append([ele for ele in cols if ele])
result = pd.DataFrame(data, columns=['Date', '1 Mo', '3 Mo', '6 Mo', '1 Yr', '2 Yr', '3 Yr', '5 Yr', '7 Yr', '10 Yr', '20 Yr', '30 Yr'])
print(result)