《机器学习与安全》读书笔记
最近看了一本《Machine Learning and Security》的翻译版,原书应该是安全数据科学领域一本比较不错的而且较为基础的书,奈何翻译的太差而且本人水平有限,对书中的许多内容了解的不多,而且书中的代码部分并没有自己亲自实现,只是选取了安全领域的异常检测、恶意软件分析和网络流量分析三个 ...
阅读更多
十分钟入门Pandas
原文:pandas官方文档 10 minutes to pandas import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inline 1 创建对象 1.1 Series Series是 ...
阅读更多
Python3爬虫笔记-解析库BeautifulSoup
1 简介 Beautiful Soup:Python的一个HTML或XML的解析库,借助网页的结构和属性等特性来解析网页。有了它,我们不用再去写一些复杂的正则表达式,只需要简单的几条语句,就可以完成网页中某个元素的提取。 Beautiful Soup在解析时实际上依赖解析器,这里推荐使用lxml ...
阅读更多
Python3爬虫笔记-解析库XPath
XPath概述:XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言。它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索。 XPath常用规则 表达式 描述 nodename 选取此节点的所有子节点 / 从当 ...
阅读更多
Python3爬虫笔记-正则表达式
常用的匹配规则 模式 描述 \w 匹配字母、数字及下划线 \W 匹配不是字母、数字及下划线的字符 \s 匹配任意空白字符,等价于[\t\n\r\f] \S 匹配任意非空字符 \d 匹配任意数字,等价于[0-9] \D 匹配任意非数字的字符 \A 匹配字符串开头 ...
阅读更多
Python3爬虫笔记-requests
在request中,所有的请求都可以用以请求名称命名的方法来调用: r = requests.get('https://www.baidu.com/')r = requests.post('http://httpbin.org/post')r = requests.put('http://htt ...
阅读更多
Python3爬虫笔记-urllib
urllib库是Python内置的HTTP请求库,不需要额外安装。它包含如下4个模块: request:HTTP请求模块 error:异常处理模块 parse:提供URL处理方法,包括拆分、解析、合并等 robotparser:识别网站等robot.txt文件 1 urllib.requ ...
阅读更多
Python网络编程-UDP
1 服务器 2.1 绑定端口 s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)# 绑定端口:s.bind(('127.0.0.1', 9999)) SOCK_DGRAM:指定了这个Socket的类型是UDP。 绑定端口和TCP一样,但是不 ...
阅读更多
Python网络编程-TCP
1 客户端 Socket:表示打开了一个网络链接,需要知道目标计算机的IP地址、端口号和协议类型。 1.1创建一个Socket连接: # 导入socket库:import socket# 创建一个socket:s = socket.socket(socket.AF_INET, socket. ...
阅读更多
神经网络的数据表示-张量Tensor
本文是《Python深度学习》一书的相关笔记。 张量(tensor)是一个数据容器,它所包含的一般是数值数据。下面是张量中的一些名词: 轴(axis):张量的维度( dimension);张量轴的个数也称作阶. 形状(shaple):这是一个整数元组,表示张量沿每个轴的维度大小(元素个数)。例如, ...
阅读更多