2017年4月5日 星期三 阴

今早一上午看了半天GPS的log,好不容易回复完邮件,去吃完不素不霸后,回来找点事情干干,先分析QQ群里A和B是不是同一个人。先从QQ导出明文的聊天记录,把A和B的聊天记录再用文后的脚本隔离出来,最后用UE查看说话的语气,简单统计一下频率,发现A和B不是同一个人。

对的 —- A 34次,B 0次 是的啊 —- A 23次,B 0次 [表情] —- A 6次,B 50次 …… —- A 0次,B 26次

没有用什么结巴分词之类的统计高频词,我只是在想,现在很多体育新闻都是机器人写的,我要不要把每天的聊天记录到统计出来做一个摘要?要是能做出来自己看看也爽。

[code] #! /usr/bin/env python #coding=utf-8 import re

sbstr = ‘‘‘201\d-\d+-\d+ \d+:\d+:\d+’’’# .*?(\d+)’’’

def main(qq = ‘1234567890’): result = [] with open(‘2016qq.txt’,‘r’) as f: lines = f.readlines() bingo = 0 for line in lines: if re.search(sbstr,line): if qq in line: bingo = 1 else: bingo = 0 if bingo: result.append(line) with open(’%s.txt’ % (qq),‘w’) as f: f.write(’’.join(result))

if name == ‘main’: qq = ‘1234567890’ main(qq)

[/code]