`
文章列表
eblearn介绍视频: http://videolectures.net/mlss05us_lecun_ebmli/   深度学习入门(andrewNG): http://openclassroom.stanford.edu/MainFolder/CoursePage.php?course=DeepLearning
【前面部分为转载--begin】 通过 采集系统 我们采 集了大量文本数据,但是文本中有很多重复数据影响我们对于结果的分析。分析前我们需要对这些数据去除重复,如何选择和设计文本的去重算法?常见的有余弦夹 角算法、欧式距离、Jaccard相似度、最长公共子串、编辑距离等。这些算法对于待比较的文本数据不多时还比较好用,如果我们的爬虫每天采集的数据以千万计算,我们如何对于这些海量千万级的数据进行高效的合并去重。最简单的做法是拿着待比较的文本和数据库中所有的文本比较一遍如果是重复的数据就标示为重复。看起来很简单,我们来做个测试,就拿最简单的两个数据使用Apache提供的 Levenshtein fo ...
2014.9.12   心灵捕手,一个算的上励志的旧影片,一个不安份的天才少年,在被数学家发现后,打开心扉,重拾新生活的故事。   成功=才能+机遇+真情   威尔经历了太多的非人虐待与折磨,心理受伤且封闭、叛逆,但是具有很高的天份,数理化信手拈来,并能解出无解的数学难题,这让教授深深折服,折服于偶尔到的这个天才叛逆少年,无私的帮助,寻找心理医生,安排合适的工作,终于在老同学的帮助下,威尔敞开心扉,开始接受新生活。   这其中教授的作为些有私心,但是确实是帮助了威尔,否则,威尔可能20年之后还在无保障的打零工求温饱,这对威尔来说,是自己的才能吸引了教授,也在机遇中遇到了教授,并 ...

mac卸载软件

    博客分类:
  • mac
1、mac 卸载mysql 1 sudo rm /usr/local/mysql2 sudo rm -rf /usr/local/mysql*3 sudo rm -rf /Library/StartupItems/MySQLCOM4 sudo rm -rf /Library/PreferencePanes/My*5 vim /etc/hostconfig (and removed the line MYSQLCOM=-YES-)6 rm -rf ~/Library/PreferencePanes/My*7 sudo rm -rf /Library/Receipts/mysql*8 sudo ...
# # Lists of fingerprints for passive fingerprint monitoring # Updated 23 May, 2000 # # Mail your signatures to Lance Spitzner <lance@spitzner.net> # # OS VERSION PLATFORM TTL WINDOW DF TOS #--- ------- -------- --- ----------- -- --- DC-OSx 1.1-95 Pyramid/NI ...

mac ox-s快捷键

一.Mac OSX 快捷键 ctrl+shift                                    快速放大dock的图标会暂时放大,而如果你开启了dock放大Command+Option+W                将所有窗口关闭Command+W                             将当前窗口关闭(可以关闭Safari标签栏,很实用) Command+Option+M                将所有窗口最小化 Command+Q                             关闭当前应用程序(相当于Dock鼠标右键推出.很 ...
云服务”现在已经快成了一个家喻户晓的词了。如果你不知道PaaS, IaaS 和SaaS的区别,那么也没啥,因为很多人确实不知道。  “云”其实是互联网的一个隐喻,“云计算”其实就是使用互联网来接入存储或者运行在远程服 ...

上海生活小感

第一次在上海待这么久的时间,感觉这里很湿热,指尖起了湿疹,已经脱了层屁,还在此起彼伏的长着,晚上睡觉时觉着很痒。 在这里调研一个叫机器指纹的东西,一直都不清楚这个组大家都在做什么,入职的时候没有入职培 ...
ACID: Database (v100-103) ER Diagram Snort (and other devices) log to database with the following schema:   Snort 1.8 (DB v100-103) and ACID 0.9.6b10 Database ER diagram   Table Component Description schema Snort
3. RTTM: ROUND-TRIP TIME MEASUREMENT 往返时间衡量 3.1 Introduction Accurate and current RTT estimates are necessary to adapt to changing traffic conditions and to avoid an instability known as "congestion collapse" [Nagle84] in a busy network. However, accu ...
  scp   -P 11111 tcp_client  jidong.shao@192.168.8.103:/home/jidong.shao/xiu.yi   其中: 1.-P 指定的时目标机器的端口,这里是指ip=192.168.8.103的目标机器端口 2.-P 一定紧跟scp后面 3.如示例,为将tcp_client拷贝至ip为192.168.8.103且端口为11111的目标机器
Know Your Enemy: Passive Fingerprinting 了解你的敌人:被动指纹Identifying remote hosts, without them knowing 识别远程主机,在他们无意识的状态下   Honeynet Project http://project.honeynet.org Last Modified: 04 March, 2002 One of the challenges of network security i ...
21 * 一个变量除了数据类型之外,还有属性: 22 * (1)存储类别:C++允许使用auto,static,register,extern 4种存储类别 23 * (2)作用域:程序中可以引用该变量的区域 24 * (3)存储周期:变量在内存的存储期限 25 * 从作用域角度,有局部变量和全局变量 26 * (1)局部变量: 27 * 自动变量,即动态局部变量(离开函数,值消失) 28 * 静态局部变量(离开函数,值仍保存) 29 * 寄存器变量(离开函数,值消失) 30 * 形式参数(可定义 ...
9 /** 10 * @file test_template.cpp 11 * @author yixiu01(com@baidu.com) 12 * @date 2014/07/08 11:33:51 13 * @brief-模板学习 14 *-- 15 **/ 16 #include<iostream> 17 using namespace std ; 18 //定义模板的一般形式 19 //函数模板只适用于函数的参数个数相同而类型不同, 且函数体相同的情况 20 template<typename T> ...
  原文  http://www.aiweibang.com/yuedu/tech/440707.html 网上有很多优秀、火爆的网站,相信大家一定会想知道这些网站的发展过程是怎样的?他的用户增长速度是怎样的?现在的PV是多少?我们能够看到网站现在的样子,但是相信你也想知道它以前设计的样子。尤其是奋斗中的站长们,你们应该对竞争对手或者行业前辈的推广方法和发展过程非常感兴趣。在你想要设计一个和其他人不一样的UI或者功能的时候,或许其他人早就在半年前已经尝试过,后来砍掉或者修改掉了。 获得这些机密信息的最简单的方法就是打入敌人内部,要么去结识该公司的产品人员和市场营销人员,要么
Global site tag (gtag.js) - Google Analytics