基于word2vec的红楼梦人物关系分析

基于word2vec的红楼梦人物关系分析

word2vec是Google公司在2013年提出的一种词嵌入算法。使用word2vec算法对词汇进行向量化后,原来的近义词在向量空间中是邻近的,因此word2vec可以很好的保留原来词汇之间的相似性。

阅读更多
sklearn踩坑

sklearn踩坑

这几天在做毕业设计,想做一个微博的情感分析,想着实现两种方式,一是朴素贝叶斯,二是用LSTM。

在做朴素贝叶斯的时候,据网上看到的一些文章说,训练的速度应该是很快的。但是我的训练速度却很慢,分析了一下发现是文本分词、清洗占去了大量的时间。我的语料大概12w行,20MB左右。文本处理需要一分多钟,而朴素贝叶斯的训练时间只需要一秒钟左右。

于是想把文本处理的结果,保存起来,下次直接使用,就不需要每次都多等一分钟了。

阅读更多
博客迁移

博客迁移

白嫖的阿里云服务器今年七月份就要到期了,又白嫖了两年的腾讯云,于是想着把自己的博客迁移到腾讯云上。

之前在阿里云上部署hexo博客的时候什么都不懂,是一篇篇教程试出来的。这次在部署写一份详细一点的教程记录一下部署过程。

阅读更多
Nginx 添加SSL证书
Python连接MySQL

Python连接MySQL

前言

毕设需要保存大量数据,于是想在服务器上运行一个数据库。

Cent OS 默认的 MySQL是Mariadb版本的,据说这个版本是在MySQL被Oracle并购之后,一些MySQL的老员工考虑到MySQL可能被商用而发行的一个免费开源版本。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
$ screenfetch
.. root@Dicer
.PLTJ. OS: CentOS
<><><><> Kernel: x86_64 Linux 3.10.0-957.21.3.el7.x86_64
KKSSV' 4KKK LJ KKKL.'VSSKK Uptime: 596d 20h 16m
KKV' 4KKKKK LJ KKKKAL 'VKK Packages: 569
V' ' 'VKKKK LJ KKKKV' ' 'V Shell: zsh 5.0.2
.4MA.' 'VKK LJ KKV' '.4Mb. Disk: 12G / 41G (30%)
. KKKKKA.' 'V LJ V' '.4KKKKK . CPU: Intel Xeon E5-2682 v4 @ 2.494GHz
.4D KKKKKKKA.'' LJ ''.4KKKKKKK FA. GPU: Cirrus Logic GD 5446
<QDD ++++++++++++ ++++++++++++ GFD> RAM: 488MiB / 1838MiB
'VD KKKKKKKK'.. LJ ..'KKKKKKKK FV
' VKKKKK'. .4 LJ K. .'KKKKKV '
'VK'. .4KK LJ KKA. .'KV'
A. . .4KKKK LJ KKKKA. . .4
KKA. 'KKKKK LJ KKKKK' .4KK
KKSSA. VKKK LJ KKKV .4SSKK
<><><><>
'MKKM'
''
阅读更多