Python通过私信消息提取博主的赠书活动地址

2024-02-27 1875阅读

温馨提示：这篇文章已超过403天没有更新，请注意相关的内容是否还可用！

文章目录

前言
背景
设计
开发
- 1.引入模块
- 2.获取私信内容
- 3.根据文本提取url的方法
- 4.获取包含‘书’的url
- 5.程序入口
- 效果
- 总结
- 最后
  前言
  
  博主空空star
  主页空空star的主页
  大家好，我是空空star，本篇给大家分享一下《通过私信消息提取博主的赠书活动地址》。
  
  背景
  
  关注的博主中有一些赠书活动私信，如何从大量私信中提取出来我们想参与赠书活动的博客地址。
  
  设计
  1. 获取私信列表；
  2. 提取内容包含‘书’的私信内容；
  3. 从内容中提取url。
  开发
  
  1.引入模块
```
import pprint
import re
import requests
```
  2.获取私信内容
  
  获取每个用户最新一条私信内容
```
def get_msg(username,usertoken,page):
    url = f'https://msg.csdn.net/v1/im/query/historySession3?page={page}&pageSize=40'
    headers = {
         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36 Edge/18.17763',
         'Cookie': f'UserName={username}; UserToken={usertoken};'
    }
    res = requests.get(url, headers=headers)
    return res.json()
```
  3.根据文本提取url的方法
```
def get_urls(text):
    urls = re.findall(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*,]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', text)
    return urls
```
  4.获取包含‘书’的url
```
def get_about_book(msg):
    about_book_list = []
    datas = msg['data']
    for data in datas:
        if '书' in data['content']:
            username = data['username']
            nickname = data['nickname']
            content = data['content'].replace('\n', '')
            urls = get_urls(content)
            msg_dict = {
                'username': username,
                'nickname': nickname,
                'content': content,
                'urls': urls
            }
            about_book_list.append(msg_dict)
    return about_book_list
```
  5.程序入口
```
if __name__ == '__main__':
	# 遍历前3页的私信消息
    for page in range(1, 4):
        msg = get_msg('你的username', '你的usertoken', page)
        about_book_list = get_about_book(msg)
        print(f'第{page}页的赠书活动:')
        pprint.pprint(about_book_list)
```
  效果
  
  第1页的赠书活动:
  [{‘content’: ‘『赠书活动｜第十三期』《算力经济：从超级计算到云计算》http://t.csdn.cn/p2xwU’,
  ‘nickname’: ‘wei_shuo’,
  ‘urls’: [‘http://t.csdn.cn/p2xwU’],
  ‘username’: ‘weixin_62765017’},
  {‘content’: ‘算力经济：从超级计算到云计算——（文末送书）http://t.csdn.cn/NfTcw本期赠书三本：《算力经济：从超级计算到云计算》获得方式：高质量的评论+赞数的前两名各获得一本！评论区随机挑选一位好兄弟送书一本！截止时间：6月29日—7月1日中午12时公布时间：7月1日下午1点’,
  ‘nickname’: ‘网络豆’,
  ‘urls’: [‘http://t.csdn.cn/NfTcw’],
  ‘username’: ‘yj11290301’},
  {‘content’: ‘三连文章抽3人送人工智能书，AI学习之路分享：https://blog.csdn.net/m0_63947499/article/details/131371175’,
  ‘nickname’: ‘陈橘又青’,
  ‘urls’: [‘https://blog.csdn.net/m0_63947499/article/details/131371175’],
  ‘username’: ‘m0_63947499’},
  {‘content’: ‘【派森送书-第二十六期】《企业性能测试》送书5人http://t.csdn.cn/IVIB9上方文章链接进去点赞收藏，评论区留言“人生苦短，拒绝内卷！”每人最多评论三次！大数据分析新文《基于LightGBM算法构建公司破产预测模型》https://blog.csdn.net/m0_64336780/article/details/131343629，期待家人们的三连支持！评论区回访！’,
  ‘nickname’: ‘艾派森’,
  ‘urls’: [‘http://t.csdn.cn/IVIB9’,
  ‘https://blog.csdn.net/m0_64336780/article/details/131343629’],
  ‘username’: ‘m0_64336780’}]
  
  总结
  
  最后
```
如果您不知道如何支持我，
InsCode AI列了一些支持博主的句子供您参考：
```
  博主写的文章很有深度，收获了很多知识。
  博主的写作风格幽默风趣。
  博主勇于分享自己的经验和教训，让初学者从中受益匪浅。
  博主的思想独到，文章读起来让人格外振奋。
  博主为人很好，乐于助人，回复读者的问题也非常及时。
  博主的专业知识非常全面，无论是哪个领域的问题都能给出详细的解答。

博主	空空star
主页	空空star的主页

免责声明：我们致力于保护作者版权，注重分享，被刊用文章因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明：本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度，360，搜狗等多加搜索引擎自动关键词搜索配图，如有侵权的图片，请第一时间联系我们，邮箱：ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

Python通过私信消息提取博主的赠书活动地址

文章目录

前言

背景

设计

开发

1.引入模块

2.获取私信内容

3.根据文本提取url的方法

4.获取包含‘书’的url

5.程序入口

效果

总结

最后

相关阅读

怎么把织梦的模板替换?

dedecms怎么调用特定的栏目文档?

怎么抓包一个网页?

wap怎么封装app?

目录[+]