从事科技查新这个行业10多年了,作为一个资深查新员,每天重复着相同的工作流程,从公司系统打开自己的任务列表,一个一个来写,有很多是从中介机构来的,也有直接客户,查看用户的委托单,查看查新点,然后打开相应的文献数据库查询界面,根据客户委托单的内容,提炼出关键词,在不同数据进行搜索,然后根据结果,来给客户的查新委托进行一个评价,出具科技查新报告,盖章,邮寄。
时间一久,人也越来越疲劳,专家说因为工作内容高度雷同,人的大脑就不会兴奋,不会产生新的突触细胞,也不会产生新的链接,大脑长期不用,也是会生锈的,但是重复相同的工作,估计也会生锈,因为没有新的大脑通路产生。
我曾经在想,我们是否可以弄一个科技查新自动查新的系统呢?以前我也想过,但是咨询了一下程序员朋友,他说第一步,你们有国内外那么多文献数据库系统的数据吗?没有的话,相当于盖楼没有地基,你上面盖的再豪华,地基不稳,也是会瞬间轰然倒塌的。
所以后面就没有去考虑过这个问题,我觉得人家说的有道理,我们现在的文献数据库系统,特别是国外的系统,很多都是花钱买的使用权,我们没有人家的基础数据,所以也不可能在这个基础上产生新的应用,但是最近大家都在讨论python,爬虫,我也感兴趣,就去研究了一下,突然觉得也不是不能搞啊!
比如虽然我们没有基础数据,但是人家有啊!我们也有人家的账号,我们可以利用python放出爬虫去爬人家的数据啊!这样我们也不就有了数据么?
我知道这个想法有点等级太低,比如有技术人员说人家凭什么给你爬,就算你有收费账号可以人工查,不代表你们可以大量的用机器人去查啊!频繁操作人家很快就把你封了,但是我看到企查查之类的网站,可以查询那么多公司的信息,我想,总不至于工商总局给他们提供数据吧!肯定也是爬虫爬的,人家可以,我们为什么不可以呢?
所以我想,解决了这个问题,就把地基打好了,科技查新自动化,也就看到了希望。
莫非我去研究python爬虫?