百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

手把手教你利用python代码快速获取双色球历史数据(附源码)

off999 2025-04-27 15:34 132 浏览 0 评论

一、windows安装python环境

1、打开浏览器,在搜索框中输入Python,进入到Python的官网中。


2、在Python官网中进入Downloads菜单栏,我们选择windows版本


3、下载对应的Python安装包


4、找到下载的Python包,双击安装



5、cmd命令验证是否安装成功


至此,Python安装完成

6、安装Python依赖库

cmd直接运行命令pip install requests beautifulsoup4 openpyxl


二、编写代码

1、桌面新建文件夹test,文件夹内新建文件test.py。

2、复制代码到test.py中(代码私信获取)

import requests

from bs4 import BeautifulSoup

from openpyxl import Workbook

import concurrent.futures

import re

import time

import random


# 初始化工作簿

wb = Workbook()

ws = wb.active

ws.append(['期号', '开奖日期', '红球1', '红球2', '红球3', '红球4', '红球5', '红球6', '蓝球'])


# 配置中心(动态适配)

CONFIG = {

'BASE_URL': 'https://kaijiang.zhcw.com/zhcw/html/ssq/list_%d.html',

'HEADERS': {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36',

'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',

'Accept-Language': 'zh-CN,zh;q=0.9',

'Connection': 'keep-alive'

},

'MAX_WORKERS': 20,

'RETRIES': 3,

'DELAY_RANGE': (0.1, 0.3),

'PAGINATION_SELECTORS': [

'p.pg',

'div.pagination',

'nav.pagination'

],

'PAGE_PATTERN': re.compile(r'pageNum=(\d+)'),

'TABLE_SELECTORS': [

'table.wqhgt',

'table.lottery-table'

]

}


def get_valid_pages():

"""智能分页解析(动态适配不同网页结构)"""

try:

response = requests.get(CONFIG['BASE_URL'] % 1, headers=CONFIG['HEADERS'], timeout=10)

print(f"请求状态码: {response.status_code}")

print(f"请求内容(前500字符): {response.text[:500]}")

response.raise_for_status()

soup = BeautifulSoup(response.text, 'html.parser')


# 尝试所有分页选择器

pagination = None

for selector in CONFIG['PAGINATION_SELECTORS']:

pagination = soup.select_one(selector)

if pagination:

print(f"找到分页区域,选择器为: {selector}")

print(f"分页区域完整HTML内容: {pagination.prettify()}")

break


if not pagination:

print("未找到分页区域,默认返回1页")

return [1]


# 提取总页数

total_pages_text = pagination.find_all('strong')[0].get_text(strip=True)

try:

total_pages = int(total_pages_text)

except ValueError:

print("无法提取总页数,默认返回1页")

return [1]


# 生成完整的页码列表

pages = list(range(1, total_pages + 1))

print(f"生成完整页码列表: {pages}")

return pages


except Exception as e:

print(f"分页解析错误: {str(e)}")

return [1]


def download_page(page):

"""带智能重试的页面下载"""

url = f'https://kaijiang.zhcw.com/zhcw/inc/ssq/ssq_wqhg.jsp?pageNum={page}'

for retry in range(CONFIG['RETRIES']):

try:

time.sleep(random.uniform(*CONFIG['DELAY_RANGE']))


response = requests.get(url, headers=CONFIG['HEADERS'], timeout=10)

print(f"页面 {page} 请求状态码: {response.status_code}")

print(f"页面 {page} 请求内容(前500字符): {response.text[:500]}")

response.raise_for_status()


soup = BeautifulSoup(response.content, 'html.parser')

table = None

for selector in CONFIG['TABLE_SELECTORS']:

table = soup.select_one(selector)

if table:

print(f"页面 {page} 找到表格,选择器为: {selector}")

break


if not table:

# 打印所有表格,辅助定位

all_tables = soup.find_all('table')

print(f"页面 {page} 未找到表格数据,页面上共有 {len(all_tables)} 个表格:")

for idx, tbl in enumerate(all_tables):

print(f"表格 {idx + 1} 内容(前200字符): {tbl.text[:200]}")

return []


return parse_table(table)


except Exception as e:

print(f"页面 {page} 重试 {retry + 1}/{CONFIG['RETRIES']}: {str(e)}")


return []


def parse_table(table):

"""鲁棒的数据解析(处理结构变化)"""

data = []

for row in table.find_all('tr')[1:]:

tds = row.find_all('td')

if len(tds) < 3:

continue


try:

cells = [td.get_text(strip=True) for td in tds[:3]]

if len(cells) < 3:

continue


issue, date = auto_detect_issue_date(cells)

balls = []

# 尝试不同的球号提取方式

em_tags = tds[2].find_all('em')

if em_tags:

balls = [em.get_text(strip=True) for em in em_tags]

else:

balls = cells[2].split()


if len(balls) == 7:

data.append([issue, date] + balls[:6] + [balls[6]])


except Exception as e:

print(f"行解析错误: {str(e)}")


return data


def auto_detect_issue_date(cells):

"""智能检测期号和日期(处理列顺序变化)"""

for i, cell in enumerate(cells):

if re.match(r'\d{4}-\d{2}-\d{2}', cell):

date = cell

issue = cells[(i + 1) % 3]

return issue, date

return cells[0], cells[1]


def main():

start_time = time.time()

total_rows = 0

all_data = []


# 智能分页解析(支持结构变化)

pages = get_valid_pages()

total_pages = max(pages) if pages else 1

print(f"检测到有效页数: {total_pages} 页,具体页码: {pages}")


# 并发下载(线程池)

with concurrent.futures.ThreadPoolExecutor(max_workers=CONFIG['MAX_WORKERS']) as executor:

futures = {executor.submit(download_page, page): page for page in pages}


for future in concurrent.futures.as_completed(futures):

data = future.result()

all_data.extend(data)

for row in data:

total_rows += 1

print(f"页面 {futures[future]} 完成: {len(data)} 条")


# 按日期降序排序

all_data.sort(key=lambda x: x[1], reverse=True)


# 将排序后的数据写入 Excel

for row in all_data:

ws.append(row)


# 保存文件

try:

wb.save('双色球历史数据.xlsx')

print(f"\n操作完成!共获取 {total_rows} 条数据(表头1行)")

except PermissionError:

print("错误:请关闭已打开的Excel文件后重试")

finally:

wb.close()


# 性能报告

if time.time() - start_time > 0:

print(f"耗时: {time.time() - start_time:.2f} 秒 | 速度: {total_rows / (time.time() - start_time):.1f} 条/秒")

else:

print("耗时过短,无法计算速度。")


if __name__ == '__main__':

main()



3、右击桌面test文件夹,选择在终端中打开。

4、运行命令python test.py,几秒钟后会在test文件夹中生成一个名为“双色球历史数据.xlsx”的文件,即为爬到的双色球历史数据,

三、总结

1、该代码生成的 Excel 文件中的数据将按日期降序排列。

2、大大缩短时间,并发下载。提高效率。

3、动态适配页面。

4、防止反爬。

作者观点:好多网友认为获取到这个数据没什么意义。能获取到本期未开奖的号码才是牛逼。个人认为获取这个数据:1 是让大家了解下python爬虫的技术,可以慢慢掌握这个技能,举一反三,在生活学习中提高工作效率。2 是个人认为双色球是一个统计学,不是概率学,什么是统计学,就是哪组号码买的人少,主任开哪组,并不是有了这些数据,根据哪些号码长期没开,下次就一定会开,每期开奖的号码都是一次独立性事件,上次的开奖结果并不会影响下期的开奖号码。最后,祝大家好运,好好学习python技术。人人中大奖。

#python##双色球分析#

相关推荐

安全教育登录入口平台(安全教育登录入口平台官网)

122交通安全教育怎么登录:122交通网的注册方法是首先登录网址http://www.122.cn/,接着打开网页后,点击右上角的“个人登录”;其次进入邮箱注册,然后进入到注册页面,输入相关信息即可完...

大鱼吃小鱼经典版(大鱼吃小鱼经典版(经典版)官方版)

大鱼吃小鱼小鱼吃虾是于谦跟郭麒麟的《我的棒儿呢?》郭德纲说于思洋郭麒麟作诗的相声,最后郭麒麟做了一首,师傅躺在师母身上大鱼吃小鱼小鱼吃虾虾吃水水落石出师傅压师娘师娘压床床压地地动山摇。...

谷歌地球下载高清卫星地图(谷歌地球地图下载器)
  • 谷歌地球下载高清卫星地图(谷歌地球地图下载器)
  • 谷歌地球下载高清卫星地图(谷歌地球地图下载器)
  • 谷歌地球下载高清卫星地图(谷歌地球地图下载器)
  • 谷歌地球下载高清卫星地图(谷歌地球地图下载器)
哪个软件可以免费pdf转ppt(免费的pdf转ppt软件哪个好)
哪个软件可以免费pdf转ppt(免费的pdf转ppt软件哪个好)

要想将ppt免费转换为pdf的话,我们建议大家可以下一个那个wps,如果你是会员的话,可以注册为会员,这样的话,在wps里面的话,就可以免费将ppt呢转换为pdfpdf之后呢,我们就可以直接使用,不需要去直接不需要去另外保存,为什么格式转...

2026-02-04 09:03 off999

电信宽带测速官网入口(电信宽带测速官网入口app)

这个网站看看http://www.swok.cn/pcindex.jsp1.登录中国电信网上营业厅,宽带光纤,贴心服务,宽带测速2.下载第三方软件,如360等。进行在线测速进行宽带测速时,尽...

植物大战僵尸95版手机下载(植物大战僵尸95 版下载)

1可以在应用商店或者游戏平台上下载植物大战僵尸95版手机游戏。2下载教程:打开应用商店或者游戏平台,搜索“植物大战僵尸95版”,找到游戏后点击下载按钮,等待下载完成即可安装并开始游戏。3注意:确...

免费下载ppt成品的网站(ppt成品免费下载的网站有哪些)

1、Chuangkit(chuangkit.com)直达地址:chuangkit.com2、Woodo幻灯片(woodo.cn)直达链接:woodo.cn3、OfficePlus(officeplu...

2025世界杯赛程表(2025世界杯在哪个国家)

2022年卡塔尔世界杯赛程公布,全部比赛在卡塔尔境内8座球场举行,2022年,决赛阶段球队全部确定。揭幕战于当地时间11月20日19时进行,由东道主卡塔尔对阵厄瓜多尔,决赛于当地时间12月18日...

下载搜狐视频电视剧(搜狐电视剧下载安装)

搜狐视频APP下载好的视频想要导出到手机相册里方法如下1、打开手机搜狐视频软件,进入搜狐视频后我们点击右上角的“查找”,找到自已喜欢的视频。2、在“浏览器页面搜索”窗口中,输入要下载的视频的名称,然后...

pubg免费下载入口(pubg下载入口官方正版)
  • pubg免费下载入口(pubg下载入口官方正版)
  • pubg免费下载入口(pubg下载入口官方正版)
  • pubg免费下载入口(pubg下载入口官方正版)
  • pubg免费下载入口(pubg下载入口官方正版)
永久免费听歌网站(丫丫音乐网)

可以到《我爱音乐网》《好听音乐网》《一听音乐网》《YYMP3音乐网》还可以到《九天音乐网》永久免费听歌软件有酷狗音乐和天猫精灵,以前要跳舞经常要下载舞曲,我从QQ上找不到舞曲下载就从酷狗音乐上找,大多...

音乐格式转换mp3软件(音乐格式转换器免费版)

有两种方法:方法一在手机上操作:1、进入手机中的文件管理。2、在其中选择“音乐”,将显示出手机中的全部音乐。3、点击“全选”,选中所有音乐文件。4、点击屏幕右下方的省略号图标,在弹出菜单中选择“...

电子书txt下载(免费的最全的小说阅读器)

1.Z-library里面收录了近千万本电子书籍,需求量大。2.苦瓜书盘没有广告,不需要账号注册,使用起来非常简单,直接搜索预览下载即可。3.鸠摩搜书整体风格简洁清晰,书籍资源丰富。4.亚马逊图书书籍...

最好免费观看高清电影(播放免费的最好看的电影)

在目前的网上选择中,IMDb(互联网电影数据库)被认为是最全的电影网站之一。这个网站提供了各种类型的电影和电视节目的海量信息,包括剧情介绍、演员表、评价、评论等。其还提供了有关电影制作背后的详细信息,...

孤单枪手2简体中文版(孤单枪手2简体中文版官方下载)

要将《孤胆枪手2》游戏的征兵秘籍切换为中文,您可以按照以下步骤进行操作:首先,打开游戏设置选项,通常可以在游戏主菜单或游戏内部找到。然后,寻找语言选项或界面选项,点击进入。在语言选项中,选择中文作为游...

取消回复欢迎 发表评论: