蓄水池抽样(Reservoir sampling)问题

蓄水池抽样

问题: 给出一个数据流,这个数据流的长度很大或者未知。并且对该数据流中数据只能访问一次。请写出一个随机选择算法,使得数据流中所有数据被选中的概率相等。

阅读全文

基于词图的最大概率中文分词方法

分词方法分类

中文分词大致分为三类:

  • 基于字符串匹配:最大正向匹配法、逆向最大匹配法、最少切分法、双向匹配法等

阅读全文

OpenSSL

SSL


SSL 是一个缩写,代表的是 Secure Sockets Layer。它是支持在 Internet 上进行安全通信的标准,并且将数据密码术集成到了协议之中。数据在离开您的计算机之前就已经被加密,然后只有到达它预定的目标后才被解密。证书和密码学算法支持了这一切的运转,如果连接传输敏感信息,则应使用 SSL。

阅读全文

AngularJS中ui-router如何传递参数

ui-router是AngualrJS中常用的路由框架。其中ui-sref 一般使用在 a标签中,\$state.go(‘someState’)一般使用在controller里面。这两个本质上是一样的东西,查看ui-sref的源码,ui-sref最后调用的还是$state.go()方法。

阅读全文

Go语言的接口

在计算机的世界里,同一类工具不同的实现所体现出背后的哲理也是不一样的,例如 Linux 与 windows,都是操作系统,但是如果用使用windows的习惯去操作Linux是玩不转的。编程语言也一样,对于面向对象不同的语言也同过不同的方式来实现。java不支持类的多重继承,但是可以通过接口的多重继承来弥补。Python干脆在语言层面上就不提供接口这样的特性,所以要想实现接口的效果可以采用继承只有方法空实现的父类并重写父类方法来达到目的。而Go语言提供了更加灵活和抽象的接口特性。

阅读全文

数据库表空间

数据库表空间允许数据库管理员定义存储数据库对象的文件在文件系统中的位置。一旦创建了表空间,当创建数据库时就可以引用这个表空间。

通过表空间来控制数据库的磁盘存储位置有一下好处:

  1. 如果数据库初始安装所在的分区或卷耗尽了空间,并且已经无法扩展,可以在另外的分区上面创建和使用一个新的表空间,直到系统重新被配置。

阅读全文

数据库的schema

schema是对数据库逻辑的分割,schema隶属于数据库。一个数据库可以包含多个schema。

schema可以包含多种命名对象,例如:数据类型、函数等。不同的schema中可以包含相同的对象名而不会冲突。

使用schema的原因主要有:

  1. 允许多个用户使用同一个数据库而互不干扰

阅读全文

关于前后端分离的一些想法

为什么要前端分离?

  伴随着软件行业的快速发展,其所涉及到的方方面面的技术也越来越细分和专业化。从各公司的招聘信息便可见一斑,例如:前端工程师、算法工程师、java工程师等。

阅读全文

Hello SingleX

用Hexo搭建博客完毕,以后会将博客慢慢迁移至此。
感谢GitHub,感谢Hexo!
Hello SingleX!

阅读全文