博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python爬取流媒体_Tweepy:抓取实时流媒体tweets并保存到.csv fi中
阅读量:5742 次
发布时间:2019-06-18

本文共 1183 字,大约阅读时间需要 3 分钟。

下面是一个工作代码:#!/usr/bin/python3

# coding=utf-8

import tweepy

SEP = ';'

csv = open('OutputStreaming.csv','a')

csv.write('Date' + SEP + 'Text' + SEP + 'Location' + SEP + 'Number_Follower' + SEP + 'User_Name' + SEP + 'Friends_count\n')

class MyStreamListener(tweepy.StreamListener):

def on_status(self, status):

Created = status.created_at.strftime("%Y-%m-%d-%H:%M:%S")

Text = status.text.replace('\n', ' ').replace('\r', '').replace(SEP, ' ')

Location = ''

if status.coordinates is not None:

lon = status.coordinates['coordinates'][0]

lat = status.coordinates['coordinates'][1]

Location = lat + ',' + lon

Follower = str(status.user.followers_count)

Name = status.user.screen_name

Friend = str(status.user.friends_count)

csv.write(Created + SEP + Text + SEP + Location + SEP + Follower + SEP + Name + SEP + Friend + '\n')

def on_error(self, status_code):

print(status_code)

consumer_key = '***'

consumer_secret = '***'

access_token = '***'

access_token_secret = '***'

# stream

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)

auth.set_access_token(access_token, access_token_secret)

myStream = tweepy.Stream(auth, MyStreamListener())

myStream.filter(track=['#Yoga','#Meditation'])

转载地址:http://rfnzx.baihongyu.com/

你可能感兴趣的文章
visual studio 2005没有找到MSVCR80D.dll问题
查看>>
hive_0.11中文用户手册
查看>>
hiveserver2修改线程数
查看>>
我的友情链接
查看>>
2011.9.12
查看>>
java自带线程池和队列详细讲解
查看>>
XML教程
查看>>
AS3.0 Array常用方法总结
查看>>
oracle体系结构
查看>>
POJ 1016 Numbers That Count 不难,但要注意细节
查看>>
J2音乐房
查看>>
Microsoft Exchange Server 2010与Office 365混合部署升级到Exchange Server 2016混合部署汇总...
查看>>
Proxy服务器配置_Squid
查看>>
nagios在apache上安装配置
查看>>
开启“无线网络”,提示:请启动windows零配置wzc服务
查看>>
【SDN】Openflow协议中对LLDP算法的理解--如何判断非OF区域的存在
查看>>
纯DIV+CSS简单实现Tab选项卡左右切换效果
查看>>
帧中继交换机配置实例
查看>>
【原创】MySQL里求给定的时间是所在月份的第几个礼拜
查看>>
怎么给PDF添加水印,PDF添加水印的方法
查看>>