2017年4月5日 星期三 阴
今早一上午看了半天GPS的log,好不容易回复完邮件,去吃完不素不霸后,回来找点事情干干,先分析QQ群里A和B是不是同一个人。先从QQ导出明文的聊天记录,把A和B的聊天记录再用文后的脚本隔离出来,最后用UE查看说话的语气,简单统计一下频率,发现A和B不是同一个人。
对的 —- A 34次,B 0次 是的啊 —- A 23次,B 0次 [表情] —- A 6次,B 50次 …… —- A 0次,B 26次
没有用什么结巴分词之类的统计高频词,我只是在想,现在很多体育新闻都是机器人写的,我要不要把每天的聊天记录到统计出来做一个摘要?要是能做出来自己看看也爽。
[code] #! /usr/bin/env python #coding=utf-8 import re
sbstr = ‘‘‘201\d-\d+-\d+ \d+:\d+:\d+’’’# .*?(\d+)’’’
def main(qq = ‘1234567890’): result = [] with open(‘2016qq.txt’,‘r’) as f: lines = f.readlines() bingo = 0 for line in lines: if re.search(sbstr,line): if qq in line: bingo = 1 else: bingo = 0 if bingo: result.append(line) with open(’%s.txt’ % (qq),‘w’) as f: f.write(’’.join(result))
if name == ‘main’: qq = ‘1234567890’ main(qq)
[/code]
...