Godsing's Blog

Always growing


  • 首页

  • 标签

  • 分类

  • 归档

  • 公益404

【总结】数据库三大范式、反范式

发表于 2021-05-28 | 更新于: 2021-05-29 | | 阅读次数:
字数统计: 5,281 字 | 阅读时长 ≈ 18 分钟

前言

每一个参与设计数据库表的人,都应该了解数据库范式。也许,你可以故意设计不符合第三范式(3NF)要求的数据库表,但前提是你应该知道什么是第三范式。

带着以下问题阅读本文,会更有收获哦!

  • 什么是数据库范式?
  • 为什么需要遵循某些范式?
  • 怎么做才算遵循了范式?
  • 什么时候不需要遵循范式?

当然,对于这里的每个问题,不会单独作为一节进行展开。下文的组织结构是,对每个范式逐一进行介绍,最后进行总结。在这个过程中,以上的几个问题自然就会解决。

阅读全文 »

为什么验证集和测试集要分开?

发表于 2018-08-13 | 更新于: 2018-08-13 | | 阅读次数:
字数统计: 1,648 字 | 阅读时长 ≈ 8 分钟

以下是 stackexchange.com 上的一个问题以及回答。最后记录自己的思考和总结。

What is the difference between test set and validation set?

I found this confusing when I use the neural network toolbox in Matlab.
It divided the raw data set into three parts:

  1. training set
  2. validation set
  3. test set
阅读全文 »

【中文分词】常见工具及算法

发表于 2018-08-06 | 更新于: 2018-08-07 | | 阅读次数:
字数统计: 4,846 字 | 阅读时长 ≈ 18 分钟

我始终认为,学习新事物的时候,若能先有一个感性的认识,再去学具体的抽象知识和原理会有更深的体会。因此,本文首先介绍中文分词常用的工具及基本用法,然后再说明分词常用算法的原理或给出学习链接,最后总结中文分词的主要难点。

常见工具及用法

工具1:pyltp

阅读全文 »

Linux下shadowsocks各种代理方式总结

发表于 2018-04-13 | 更新于: 2021-05-11 | | 阅读次数:
字数统计: 3,635 字 | 阅读时长 ≈ 14 分钟

前言

本文算是一篇总结,把使用 shadowsocks无GUI客户端 的各种常见的代理方式梳理一遍,给有需要的人,避免走同样的弯路。以下是本文的预备条件:

  • Linux 系统(本文用的是 Ubuntu 16.04)

  • 已有 shadowsocks 帐号。获取免费帐号/自行搭建shadowsocks服务端 可以参考:

    寻找Shadowsocks账号/搭建Shadowsocks服务

    『原创』ShadowsocksR MudbJSON模式多用户一键脚本 支持流量限制等

    『视频』ShadowsocksR 服务端一键脚本安装 新手小白视频教程

阅读全文 »

Ubuntu解压缩与文件(名/内容)乱码解决方案

发表于 2018-01-31 | 更新于: 2018-04-15 | | 阅读次数:
字数统计: 1,699 字 | 阅读时长 ≈ 7 分钟

我的另一篇笔记:中文编码知识

1. 分析

1.1 zip解压时文件乱码

本质问题还是zip格式的缺陷,没有字段标志出文件名的编码格式。
ZIP在压缩与解压缩的时候默认使用了系统的本地编码,如windows中文环境下的编码多为gbk,gb2312,日文环境下是JIS,linux默认编码为UTF8等;那么在不同系统环境下,只要压缩与解压缩的编码不一致,就会出现乱码。1

阅读全文 »

中文字符集编码GB2312、GBK(CP936)、GB18030

发表于 2018-01-21 | 更新于: 2018-04-15 | | 阅读次数:
字数统计: 1,375 字 | 阅读时长 ≈ 5 分钟

概要

在技术编码方面,演化顺序为:

ASCII ⇒ GB2312 ⇒ GBK ⇒ GB18030

GB2312或GB2312-80

GB2312或GB2312-80是中国国家标准简体中文字符集,1981年5月1日实施,通行于中国大陆,新加坡也采用此编码。GB2312标准共收录6763个汉字以及包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个字符。

阅读全文 »

动态规划

发表于 2018-01-19 | 更新于: 2021-05-11 | | 阅读次数:
字数统计: 225 字 | 阅读时长 ≈ 1 分钟

核心概念

  • 阶段$k$
  • 状态变量$x_k$(状态集合)
  • 决策变量$u_k$(决策集合$D_k(x_k)$,状态转移方程$x_{k+1}=T(x_k,u_k)$可以看成是理所应当的,是$u_k$作为决策变量的必要条件)
  • 最优指标函数$f_k(x_k)$(指标函数$V_{k,n}$:当前状态变量、现阶段子策略(=决策变量+下阶段最优子策略) 的函数;阶段指标$v_k(x_k,u_k)$;策略$p_{k,n}$=决策序列;后部子过程)
阅读全文 »
Godsing

Godsing

Permission to be human.

7 日志
17 标签
GitHub E-Mail Twitter Facebook
友情链接
  • Zerteen
© 2018 — 2021 Godsing
由 Hexo 强力驱动
|
主题 — NexT.Mist