距离今年国庆摩旅回来,距离今天已经 20 天,所以这是一篇“鸽”了很久的摩旅日记。各位勿急,且待我慢慢讲来。

真·多图来袭!!!

Read more »

北灵山

城市的三月已经开始慢慢变暖,而北灵山上依旧有点冷,地面上还有未化的雪,为许久之前就计划好的徒步之旅平增些许乐趣。

Read more »

简介

随着机器学习与深度学习的发展,DNN 在图像、语音和文本类型的数据上都有了广泛的应用,其优势如下:

  • 类似图像、文本,通过对其数据进行编码,从而得到一个表征表格数据。
  • 减少对特征工程的依赖(参加过 kaggle 竞赛的同学都知道特征在模型中的重要性)。
  • 可通过 online learning 的方式更新模型。

而在表格类数据的任务中,大部分都是由决策树模型成为标配,其优势如下:

  • 可以根据决策树回溯其推理过程,可解释性较强。
  • 决策树的流形可以看作是超平面的边界,对于表格类数据的效果很好。
  • 训练速度很快。

因此如果有一种模型即吸收决策树模型的可解释性和稀疏特征选择优点,也具有 DNNend-to-end 长处,那毫无疑问就是针对表格数据的利器 - TabNet

Read more »

背景

在特征挖掘平台项目中,会遇到在不同的业务线间需要切换不同的数据库去查询原始数据来计算特征,因此需要对多个数据库进行实时切换,这里分享简单的思路及实现方案。

Read more »

简介

前面学习了卷积神经网络(CNN,卷积神经网络适合图片这类具有空间局部相关性的数据,而在新的一节中开始学习循环神经网络(RNN,循环神经网络适合具有时间序列的数据,如股票、语音对话、阅读的文本等。

本节内容包含如下:

  • 基本原理
  • 循环神经网络 RNN
  • 长短时记忆网络 LSTM
  • 门控循环网络 GRU
Read more »

简介

在之前的文章中主要介绍了神经网络的基本原理TensorFlow 使用基本的全连接层模型,而本节正如题目所言:卷积神经网络

Read more »

简介

本文内容主要来源于在学习 TensorFlow 入门过程中的实践总结项目,内容主要包含以下实战项目:

  • 线性模型实战
  • 前向传播算法实践
  • AUTO-MPG 汽车油耗预测
  • 线性分类实战
  • MNIST 手写数字数据集分类
Read more »

概述

昨天长途奔袭,一路飞奔算是回到了北京,大致算了以下本次摩旅跑了将近 1100 公里的路程。全程途径北京市、张家口市、乌兰察布市、大同市、保定市,最终回到我想念了四天的北京(主要是想念我的床,酒店的床非常不舒服😭)。

Read more »

简介

TensorFlow 是由 Google 团队开发的深度学习框架,其初衷是以最简单的方式实现机器学习和深度学习的概念。该框架融合了计算代数的优化技术,极大地方便了复杂数学表达式的计算。

TensorFlow 深度学习框架的三大核心功能:

  • 加速计算。神经网络本质上由大量的矩阵相乘、矩阵相加等基本数学运算构成,TensorFlow 的重要功能就是利用 GPU 方便地实现并行计算加速功能。
  • 自动梯度TensorFlow 可以自动构建计算图,通过 TensorFlow 提供的自动求导的功能,不需要手动推导即可计算输出对网络参数的偏导数。
  • 常用神经网络接口TensorFlow 除了提供底层的矩阵相乘、相加等数学函数,还包含常用神经网络运算函数、常用网络层、网络训练、模型保存与加载、网络部署等一系列深度学习的功能。

简单示例:

1
2
3
4
5
6
7
import tensorflow as tf

a = tf.constant(2.0)
b = tf.constant(4.0)

print('a+b=', a+b) # a+b= tf.Tensor(6.0, shape=(), dtype=float32)
# 运算时同时创建计算图 𝑐=𝑎+𝑏 和数值结果 6.0=2.0+4.0 的方式叫做命令式编程,也称为动态图模式。
Read more »