简介
特征工程将数据转换为能更好地表示潜在问题的特征,从而提高机器学习性能。
特征工程具体包含内容如下:
- 转换数据的过程。处理的数据经常是表格形式的,此时数据会被组织成行(观察值)和列(属性)。
- 特征。特征是对机器学习过程有意义的数据属性,我们需要经常查看表格,确定哪些列是特征,哪些列只是普通的属性。
- 更好地表示潜在问题。转换数据的目的在于更好地表达更大的问题。
- 提高机器学习性能。特征工程的最终目的在于获取更好的数据,以便学习算法从中挖掘模式,取得更好的效果。
Neo4j
正式支持 .Net
、 Java
、 JavaScript
、 Ruby
、 PHP
和 Python
的二进制 Bolt
协议驱动程序。这些开发平台通过引入相应的驱动程序包便可与 Neo4j
相互集成,然后就可以对 Neo4j
进行数据操作。
目前 Neo4j
支持三种开发模式,分别为:
Java
嵌入式开发模式。Neo4j
是基于 Java
语言开发的,所以他能与 Java
开发天然结合,完全可以在代码中调用 Neo4j
的 API
,并将对 Neo4j
数据库的操作嵌入在 Java
代码中。HTTP
的 HTTP API
的驱动包让非基于 JVM
的开发平台、编程语言也能够操作 Neo4j
数据库。部署主要包括:容量规划、单实例或集群安装及安装后的相关处理。
运行一个 Neo4j
数据库实例所需的系统需求清单:
CPU
:通常性能受限于内存容量和磁盘 I/O
容量。推荐配置:Intel Core i7, IBM POWER8
16~32GB
或更多。SSD w/ SATA
。Linux / UNIX
系统中存在的缓冲区高速缓存或页面高速缓存,大多数磁盘都是经过缓存进行的。因此当系统发生故障时,这种延迟可能会造成文件更新内容的丢失。推荐配置:ext4 / ZFS
。Neo4j
需要一个 Java
虚拟机,因此 Neo4j
中都会提前预装 JVM
。