吵吵   2013-08-25  阅读:2,056

“燕南飞之羽”有感于我写的关于开源信息系统的文章,在网上联系我,结果竟然都是浏阳人。他邀我去参见珠三角技术沙龙(大数据与数据挖掘)的专场,顺便见见面,聊聊天。

上次参加相关的活动,还是12年的广东省站长大会,那时候是在一个大礼堂,人特别多,我是冲着去抽奖拿Ipad的,结果奖没拿到,收到一堆名片回来了。

这次去的是技术沙龙,人数不多,但是都相对比较安静,很少有人来换名片的。去听课的人倒是什么人都有,有真心想提高技术的,有去认识人的,有期待转行去玩数据的,最离谱的是广州医学院的一个女生,学临床的,跑来凑热闹。

对于来讲课的嘉宾,大概是当做宣讲会了,有些讲师的干货不见得有多少分享,来招人、挖人的目的却显而易见,但是这也是好事儿。能够到这里来“提高技术“的人,如果不是真心来学知识的,也有可能是来找机会的,至少都是些主动的人,到这个场地来招人,其实就已经筛选了不少了,找到目标职员的概率还是大些。也许类似这样的技术沙龙,该是线下招聘的较好手段了吧。

Word Cloud Big Data

谈谈讲课的内容吧:

1、用户评分模型。主讲人大强,某银行信用卡中心数据挖掘主管。讲了一下如何构建一个用户信用的评分模型,并且依据这个评分模型,减少坏账率,增加利润率。严格来讲,这应该还算是统计学的范畴,通过分析数据,进而做出决策。给我印象比较深刻的是,他说在数据挖掘中,懂业务才是最重要的,而模型和技术是其次的。这很像我们搞医学研究的,动不动就是统计学,但统计学只是一个工具。

2、移动广告大数据挖掘。蔡先生,应该是有米科技的技术总监。讲了一下移动广告中的数据挖掘和业务分析,但是表达的不是很好,ppt小声音也听不清楚,我睡了一觉。其中讲到从数据库中提取到的信息包括一条:在wifi模式下移动广告流量显著增加。我就在想,这不是显而易见的事情么,用wifi的时候不考虑流量,自然广告走的流量也多,这个问题需要绕一圈让数据来告诉我们么。

3、Storm: 分布式系统的消息可靠性。主讲人陈凯成,Kevin。介绍:喜Java、喜*nix、喜互联网、Clojure小白菜。坚决消灭烂代码。这个是我听过的关于技术的最棒的一堂课了,从消息构成到分布式系统消息的流动讲的非常的清晰。以前我也许觉得云计算,分布式计算是个比较麻烦的东西,但是听他讲了这样一堂课后,我终于明白分布式计算是个怎样的东西了,整个系统到底是如何协同运作的。

4、星型数据库在实际中的应用。Aaron,目前在某外资银行任职某小团队的leader,做数据仓库。”星型数据库“是一个我没听说过的名词,以为又是分布式计算了,听了才明白是数据仓库的一种模式。所谓数据仓库就是从源数据库中取出来的数据,用于做数据分析的。星型数据库就是一张事实表+多张维表的一种简单的数据残酷模型。有了这个数据仓库,我们就可以用BI软件进行数据分析了。你问我怎么分析,我也不知道,因为主讲人说到这里就不讲了。这是最烂的一颗,感觉被忽悠了。

“燕南飞之羽”的团队正在做一些LIS的开源工作,目前正在和一家三乙医院合作开发HIS,但是开源HIS的进程很是缓慢,开源了,谁来保证开发者的生活?虽然业内的人都知道他在搞开源的HIS,他一说人家也表示支持,但是仅仅是精神层面的。

他是出道比较早的一批人,在北京有一套房子,在广州有两套房子,但是因为创业,把广州的两套房子都烧给了互联网。我说我想搞开源的LIS已经就冒着比较大的风险了,可能一无所获。他说,创业风险更大!

告别时,他跟我说”坚持的你的梦想!“

我:…呵呵。

吵吵微信朋友圈,请付款实名加入:

吵吵 吵吵

2条回应:“参加了珠三角技术沙龙(大数据与数据挖掘)”

  1. 博客丛说道:

    谢谢分享~O(∩_∩)O~

  2. 初遇夏沫说道:

    我之前就从事数据仓库的项目开发,结果现在羡慕搁置了,,好伤心

发表评论

电子邮件地址不会被公开。 必填项已用*标注