使用 Ssh 命令建立网络隧道

发表于 2022-04-04 更新于 2023-07-09

0X00 前言 & 简介

说起来但凡各位用过 Linux 就应该用过 ssh 了吧，所以怎么使用 ssh 去连接一台服务器、怎么去配置 key 登陆而非密码、怎么允许/禁止 root 用户使用这种问题就不再过多讨论了，这篇文章来介绍一下 ssh隧道 这个东西。

说起来各位在生活工作中肯定遇到过这么一个情况，如图所示：我（A）自己想要访问一台机器（C）但是A和C是不通的，这时候有一台中间的机器（B），A可以访问到B且B和C也是通的（比如说梯子的应用场景）。r当然了你在中间的B机器上开一个 OpenVPN 肯定是可行的，但是一旦你的A连上了 VPN 之后所有流量也就都从B上走了，绝大多数情况下我们其实并不是很需要一个 VPN 而是需要一个轻量化的解决方案。这时候 ssh 隧道就是我们的一个很好的比较轻量化的解决方案，首先它不需要你在客户端和服务器上安装额外的软件（如果你连 ssh 都没装那就不说了）；其次它不需要配置文件，为数不多的配置直接写在命令行里；最后它不需要额外的守护进程，你不用了就直接 Ctrl + C 干掉当前进程就行了。

ssh-tunnel

ssh 隧道其实本质上来说就是转发，那我们来依次介绍一下这四种隧道（转发）方法

0X01 动态转发

动态转发是在本地建立一个通往另一台机器的隧道，然后网络监听在本地的某端口，使用 socks5 协议。使用对应的协议和端口的出口流量都会被转发到另一台机器，再由它访问后转发给你。比如你在墙内是无法访问 wikipedia 的，但是你“恰好”有一台在海外的服务器，那么你就可以通过这种方式建立一个简单且临时的小梯子。

命令格式是：ssh -D local-port username@tunnel-host -N，比如说 ssh -D 1080 [email protected] -N

-D 是绑定后面的本地端口
-N 是说非交互环境，不需要执行命令，挂着就好

这样一来就可以在浏览器上配置代理了，配上 socks5://127.0.0.1:1080 之后就可以访问更广阔的互联网了 YOU ARE FREEDOM !!!

这种动态转发其实平时用到的机会并没有很多，因为开发过程中用代理还是比较麻烦的，并不是所有软件/工具都支持独立配置代理，直接配置在浏览器或者操作系统上的话又很容易误伤到其他的进程。如果想要更细致的管理还是需要用下面的本地和远程转发方案。

0X02 本地转发

本地转发也是在本地建立隧道，监听在本地端口，一切发往本地该端口的流量都会根据配置转发到另一台机器上。比如我前几天工作中遇到的一个情景：开发机是 macOS 的，客户用来联调的服务器在他们内网需要 VPN 才行，但是他们用的 VPN 客户端没有 macOS的。所以我在 macOS 上装了个虚拟机，虚拟机起连上了他们的 VPN 也就可以访问联调环境了，但是我的 macOS 还是不能直接访问。这时候就可以用 ssh 隧道来解决问题了。

命令格式是：ssh -L local-port:target-host:target-port username@tunnel-host，比如说 ssh -L 8080:123.123.123.123:80 [email protected]

-L 指的是建立一条本地隧道 local

这样一来我再curl -XGET http://127.0.0.1:8080的时候，流量就会顺着 ssh 的隧道一路直接到最终客户的联调环境了。这种本地转发的情况是非常常用的，这样一来本来没有通的两个机器也就通过这样一条隧道连接起来了。最重要的是我们只占用了本地机器的一个端口，并不影响其他任何的系统配置和任何进程。

0X03 远程转发

远程转发是在中转的服务器上建立隧道，跟本地转发最大的不同是：本地转发只是本地用户自己建立了一条隧道给自己用，但是远程转发可以将端口共享出来给多台设备使用。还是说上面我的那个联调环境，如果说只有我一个人自己联调就用本地转发是刚刚好的，而且不用再登录到远程环境上去，也不需要远程用户比较高的权限。但是说如果我们全公司都在进行这个联调，那就可以用远程转发，在中转服务器上把自己的端口开放出来让所有用户一起使用。

命令格式是：ssh -R local-port:target-host:target-port -N local，例如 ssh -R 8080:123.123.123.123:80 -N local

-R 建立一条远程隧道 remote

这样建立起来的隧道就可以给其他机器使用了，现在所有可以访问中转机的机器都可以通过中转机的 8080 端口访问到客户的联调机。所以说这里的远程转发和本地转发除了命令执行地不同、可用的机器不同以外就没有什么比较大的区别了。

0X04 其它参数

这里再介绍几个额外的参数

-f 后台运行，这样 ssh 隧道就不用占用你当前的 shell 了
-C 压缩内容，原则上就是用 CPU 换带宽
-g 开放本地端口，如果本地转发的时候加了这个参数，那就跟远程转发差不多了

2021 年度总结

发表于 2021-12-31 更新于 2023-07-09

0X00 先胡说两句

兄弟们我的年更文章它又来了～如果你看到这篇文章的时候发现发布时间是 2021-12-31 23:59:59 但你的手机电脑告诉你还没到这个时间，不要慌，一定是你穿越了。

我也不知道为啥莫名其妙就开始写年终总结了，而且今年已经是第三年了。人确实是一种很奇怪的物种，领导老师父母让你总结一年的时候暴躁不堪，根本不想写；但是自己突然来了这个念头之后就非常认真的写了一大堆，告诉我不是我一个人有这种“病”🙄 这次的总结打算换一种方法来写，大概分成了这么几个部分：去年的年度计划情况、年内做得不错的事、没做好的事、可以分享给各位的东西。

0X01 翻车的年度计划

2019 年度总结中我说“取法其上，仅得其中；取法其中，仅得其下”，但是今年就不一样了，今年的年度计划基本可以用四个字来形容：我是废物 😢（其实没这么离谱，听我慢慢道来）

今年就不给大家详细一个个的看我的年度计划了，简单说一下吧：

阅读两个有兴趣的开源项目源码【完全没看】
动手写两个自己练手新技能/知识的小项目【几乎没写】
了解 5 个专业技能【就学到了俩】
养成 4 个良好习惯【也只坚持了俩】
读完 24 本专业无关的书【读了 17 本】
平均每月发布两篇博客【只完成了 1/3】
了解几个奇奇怪怪领域的业余知识【确实了解了几个】
多出门走走-拒绝成为肥宅【平均每月一次，完成】
考一个手动挡驾照【是的我才考驾照】
买一台 PS5【原价压根买不着】

算下来年度计划完成了有一半吧，而且还有一些原本不在年度计划里的重要的事、好玩的事、刺激的事，所以整个年度计划虽然优点拉胯但是也没有完全拉 🤪

阅读全文 »

Python 中格式化字符串的几种方式

发表于 2021-10-12 更新于 2023-07-09

0X00 前言

如果秉承着「能用就行」的原则，那么这篇文章提到的东西基本都没什么卵用；如果秉承着「写更好的代码」的原则，那么这里提到的东西也许对你有所帮助。

内容主要取材自 Effective Python，主要是作为自己学习后的一个输出而总结的这篇博客

0X01 使用 % 的 C 风格格式化

首先是沿用自 C 风格的使用 % 进行的字符串格式化方法：

>>> name = 'Shawn'
>>> job = 'developer'
>>> text = 'I am %s, a %s' % (name, job)
>>> text
'I am Shawn, a developer'
>>> height = 123.456
>>> text = 'My height is %4d.' % height
>>> text
'My height is  123.'
>>> text = 'My height is %4f.' % height
>>> text
'My height is 123.456000.'
>>> text = 'My height is %4.8f.' % height
>>> text
'My height is 123.45600000.'

这种写法在写惯了 C 的人身上比较常见，比较熟悉而且也比较简单。不过这种写法有几个问题，首先就是当百分号右侧的变量数量发生变化或者类型发生变化的时候，程序很有可能因为类型转化出现不兼容的情况（当然了，本来是 %s %4d 对应字符串和数字，现在两个都是字符串了当然就出错了）。如果要解决这种问题的话，必须每次修改都要检查百分号左右的占位符和具体数值是否能对应的伤，而且一旦占位符多了之后还很容易看花眼。

还有一个问题就是填充数值的时候通常需要对具体的值进行一些处理，比如保留某几位长度之类的，这样一来表达式可能会很长，从而显得很混乱。

coffee_price_list = [
    ('Americano', 15),
    ('Latte', 25),
    ('Cappuccino', 30)
]

for index, (name, price) in enumerate(coffee_price_list):
    content = '%d.  %-12s  -----  %.2f' % (index, name, price)
    print(content)

# output
0.  Americano     -----  15.00
1.  Latte         -----  25.00
2.  Cappuccino    -----  30.00

我们来看 for 循环里面那行，是不是确实看起来乱乱糟糟的，这还只是三个占位符，如果更多的话就会更混乱了。

第三个问题是如果要用同一个值来填充多个位置，那就需要在右侧重复多次（废话之：你想要几个就得写几个）。我们假设你有一个保证书模板，只需要填入姓名、错误和保证内容就可以生成出例如「我XX再也不YY了，我保证以后ZZ」的十万字长文。但是整篇文章里出现了大量的空位，需要填入这些 XX/YY/ZZ 怎么搞呢？你可能需要在后面写上不计其数的 '--------%s-------%s-------%s-------%s' % (xx, xx, yy, zz, zz, yy) 这种东西（别跟我说你要用 replace 那是另外的内容，这里只讨论字符串格式化😅）。

当然了这个问题也不是无解，我们使用 dict 来替换平时用的 tuple 就可以了，就是类似下面这种用法（虽然我从来没真的在代码里见过谁这么写）

value_a = 'aaaaaaaaaaaaaaaa'
value_b = 'bbbbbbbbbbbbbbbb'
value_c = 'cccccccccccccccc'

content = '''
    %(val_a)s, %(val_a)s, %(val_a)s
    %(val_b)s, %(val_b)s, %(val_b)s
    %(val_c)s, %(val_c)s, %(val_c)s
    %(val_a)s, %(val_b)s, %(val_c)s
    ''' % {
        'val_a': value_a,
        'val_b': value_b,
        'val_c': value_c
    }

print(content)

# output

    aaaaaaaaaaaaaaaa, aaaaaaaaaaaaaaaa, aaaaaaaaaaaaaaaa
    bbbbbbbbbbbbbbbb, bbbbbbbbbbbbbbbb, bbbbbbbbbbbbbbbb
    cccccccccccccccc, cccccccccccccccc, cccccccccccccccc
    aaaaaaaaaaaaaaaa, bbbbbbbbbbbbbbbb, cccccccccccccccc

虽然这种写法解决了多次重复使用的问题，但是加重了第二点也就是代码更冗长了，因为不仅要给变量做格式化，还要给每个占位符再设定一个 key 且为其匹配好。

最后就是因为每次都需要把 key 至少写两次（占位符那里一次，后面的字典里一次），甚至因为 value 过长还可能再把变量提出去单独定义一下，就会导致整个表达式非常长，比较容易出现 bug 且定位 bug 比较复杂。

0X02 另一种方法：format函数与方法

format 是我平时用的最多的一种方法了，比较常规的方法是调用str 对象的 format() 方法，例如下面这样

name_1 = 'shawn'
name_2 = 'bluce'

print('hello {}, hello {}.'.format(name_1, name_2))
print('hello {:<10}, hello {:<20}.'.format(name_1, name_2))
print('hello {1}, hello {0}.'.format(name_1, name_2))
print('hello {1}, hello {0}, hello {0}, hello {1}.'.format(name_1, name_2))

# output
hello shawn, hello bluce.
hello shawn     , hello bluce               .
hello bluce, hello shawn.
hello bluce, hello shawn, hello shawn, hello bluce.

第二种可能比较少见，不过规则比较简单，就是在花括号里写一个冒号，冒号右边可以用 C 方法格式化变量。第三四种就比较常见了，可以通过 index 来规定位置。

这种方法还有一些更高级的用法，例如在花括号里访问字典的 key 或者访问列表中的下标（好像也没见人这么用过）

data = [
    {'name': 'shawn', 'gender': 'M'},
    {'name': 'bluce', 'gender': 'F'}
]

print('{data[0][name]} and {data[1][name]} is {data[0][gender]} and {data[1][gender]}'.format(data=data))

# output
shawn and bluce is M and F

0X03 更好的方法 f-string 插值格式字符串

在 Python 3.6 中引入的这个特性可以解决上述提到的问题，语法要求格式化的字符串前面加上一个f做前缀，就类似于之前的b/r这种。这里也同样支持前面 format 那里用到的格式化方法，例如 f'{name_1:<10}, {value:.2f}' 这种。

一个简单的例子

name_1 = 'shawn'
name_2 = 'bluce'

print(f'hello {name_1}, hello {name_2}')

# output
hello shawn, hello bluce

我们现在再回过头来看一下最开始提到的四个问题：第一个，如果需要调整顺序，那么百分号左侧的正文要改，右侧的值也要改，就要改两次。现在没有百分号也就不再区分左右了，如果调整顺序那么就只调整一次就行，方便了很多。第二个，如果对填进去的值稍作处理可能会导致整个表达式变得很长。现在因为省略了百分号右边的内容，所以整个表达式还是精简了不少的。第三个，当某个变量/值要用多次的时候就需要左右共写两次那么多。用 f-string 方式的话，如果确实需要调用多次且每次都要进行修改（例如保留小数或是转成大写之类的），则可以考虑将其提取出去单独赋值，然后在格式化的时候用新值来代替，还能更加符合字符串格式化的语义。第四个是说如果使用 dict 的话会使代码变多，现在不用字典了当然也就没有这个问题了。

下面是几种用法，看起来 f-string 并没有代码量少很多，是因为这个例子并不能很明显的体现出代码量少的优势，但是已经体现出可读性和维护性的优势了。如果一眼看过去，明显是 f-string 的用法最简单清晰明了。

data = [
    {'name': 'shawn', 'score': 78.5},
    {'name': 'ami', 'score': 89.0},
    {'name': 'jack', 'score': 92.0},
    {'name': 'amber', 'score': 99.5}
]

print('------------- style_1 -------------')
for item in data:
    style_1 = 'name: %-10s score: %2.2f' % (item['name'], item['score'])
    print(style_1)

print('\n\n------------- style_2 -------------')
for item in data:
    style_2 = 'name: {:10s} score: {:2.2f}'.format(item['name'], item['score'])
    print(style_2)

print('\n\n------------- style_3 -------------')
for item in data:
    style_3 = 'name: {name:10s} score: {score:2.2f}'.format(name=item['name'], score=item['score'])
    print(style_3)

print('\n\n------------- f-string -------------')
for item in data:
    f_string = f'name: {item["name"]:10s} score: {item["score"]:2.2f}'
    print(f_string)

# output
------------- style_1 -------------
name: shawn      score: 78.50
name: ami        score: 89.00
name: jack       score: 92.00
name: amber      score: 99.50


------------- style_2 -------------
name: shawn      score: 78.50
name: ami        score: 89.00
name: jack       score: 92.00
name: amber      score: 99.50


------------- style_3 -------------
name: shawn      score: 78.50
name: ami        score: 89.00
name: jack       score: 92.00
name: amber      score: 99.50


------------- f-string -------------
name: shawn      score: 78.50
name: ami        score: 89.00
name: jack       score: 92.00
name: amber      score: 99.50

记一次惨痛的数据恢复经验

发表于 2021-07-21 更新于 2023-07-09

0X00 背景

前两段属于并不那么重要的“故事”部分，如果切实需要一些数据恢复的经验和方法的话可以直接跳到0X02部分，给个一键三连就好（哦不对这不是B站视频，那你白嫖好了）。

故事大概是这样的，之前我有一台 Synology 的成品 NAS 用来存储我自己的照片、视频、音乐、电脑数据备份和喜欢的电影，不过因为它是单盘位的用了大概三年之后它就几乎满了，我也就开始准备升级 NAS。后来经过一番调研发现自己的需求其实不太适合用 Synology 的成品，因为它性价比低的同时附带的很多软件功能我都不需要，相比于自建 NAS 所需要的计算机知识我也正好具备，就选择自己搭建一台 TrueNAS 出来。准备的配置是CPU Intel G6400 + RAM 8G X 2 + SSD 120G + SSD 240G + HDD 8T X 3 + HDD 4T，其中双核四线程的 CPU 给这台 NAS 用已经是完全没有问题了，同时因为使用 ZFS 也就配备了 16G 的内存，8T X 3 作为主要数据存储并且搭配了 240G 的缓存盘；另外那块 4T 是从老群晖上拆下来的，作为独立存储使用；最后最小的 SSD 用来装系统。当时还整理了一篇博客来记录这件事（最近有一点点小改动）。

本来我那个 4T 的盘拆下来之后就一直没用，直到前几天我突然想把它也塞到我现在的NAS里去，正好把 OMV 换成 TrueNAS，再加一个缓存盘，重构一下自用 NAS 的架构从此就不再管它了。然后我就把重要数据打包一股脑塞到了那个小硬盘里准备重建 NAS（此时我自己的照片、视频、备份文件全部都在这个小硬盘里）。等了几天需要用的 PCI-E 转 m.2 的扩展卡和 PCI-E 转 SATA 的扩展卡都到了之后就开始重新装机。

把扩展卡和 SSD 之类的都装好之后，我特意把小硬盘的线给拔了，防止在重装系统或者其他的时候误伤到它。然后开始一路顺利的安装好了 TrueNAS 并且配置好了 3 X 8T 的存储池之后关机，准备接上小硬盘电源开始往大存储池里恢复数据。

0X01 事发

拆开机箱盖、拆开侧面版、给小硬盘插上线、装好侧面版、装好机箱盖、插上电源网线、开机、坐到笔记本前、打开 Firefox 开发者版、打开 TrueNAS 管理页面、输入用户名密码、登陆、找到存储池、格式化刚刚接入的硬盘…… woc，woc，woc 我干了啥！！！

当我意识到我格式化了装满了重要数据的 4T 硬盘之后，本来整个人都很困，结果一秒钟之内就像喝了一百杯 Espresso 一样清醒了。当时脑子里的意识流差不多就是“卧槽完了、卧槽没了、卧槽出大事情了”，愣了几秒钟之后意识到了一个重要的事“刚刚格式化的是机械硬盘”，然后第一时间卸载了挂好的硬盘并且关机断电拆机拔线。

拔掉线之后冷静了一下觉得数据应该还能找回来，赶紧开始想办法。想办法的过程中又想到“我磁盘分区貌似是 xfs 来着，这个估计还难搞”，想到难搞之后整个人又是一愣🤣

然后我开始东找找西找找，看看有没有什么好办法可以恢复数据的。当时第一时间是想到找线下的数据恢复公司，但是找数据恢复公司的话就非常贵了，而且又非常麻烦，就打算想想办法有没有可能自己把数据恢复回来。又想到 DiskGenius 可以恢复，但是去官网看了一下这玩意儿好像还有点贵（官网售价 468 元人民币），当然如果肯定可以恢复回来 468 还是值得的，不过我还是想去找找看有没有便宜一点的方案。然后也陆续找了一些其他软件，要么就是没听过的小公司搞的，要么就是特别特别贵的。就在打算去买 DiskGenius 的时候发现了一个叫做 万兴恢复专家 的软件，当时第一反应是“这种名字一般都不靠谱，就像 21 天精通CPP一样不靠谱”。不过在调查了一下这个软件和公司之后，我发现背后的这家“万兴科技”是上市公司，且旗下有亿图和墨刀两大将，就打算去试试看了。

软件下载下来之后扫描了很长时间，虽然我费尽心思下载到的46G让子弹飞这种都没有扫描到，但是我最最最最重要的照片们几乎都扫描到了，然后我就眼睛都没眨的付费买了永久授权的这个软件，因为才160+块钱对于这么多重要数据来说真的不值一提，然后用了很长一段时间把数据恢复了回来。不过值得说的是，我的几十部电影无一幸存，但是自己拍的照片的幸存率超出 90%（估计的），这个我也没搞明白是为什么。

现在我已经把重要的数据都整理出来了，所以才有心情来整理这篇文章。说是一篇文章，但是前面这段可能对于看官来说都是废话，我也只是想记录一下这么个经历才把它写出来的。最后来总结一下遇到类似情况的时候应该怎么做吧。

0X02 总结

首先，首先，首先，数据恢复的最佳时机永远是在数据丢失之前做，换句话说就是 不要把自己的重要数据搞丢 。然后如果数据万一真的丢了，那么我总结了几点这次的经验也许对大家有那么一丢丢的帮助

还是强调不要删掉自己的重要数据，在删除东西之前最好冷静几秒钟，格式化磁盘之前最好冷静几分钟
如果万一删除了或者格式化了，请第一时间先弹出、卸载磁盘，保证 不要再像磁盘中写入任何数据
找到一个你信得过的数据恢复软件，接上存储设备先扫描看看（大多数收费的数据恢复软件扫描也是不要钱的，所以你可以先看看究竟能恢复出来多少数据，可以根据这个数量决定是不是要付费购买软件）
使用数据恢复软件将数据恢复出来 不要放在恢复的磁盘里 ，应该单独找个地方存储这些恢复出来的数据

什么？你说盗版软件？这种事情就不至于还用盗版软件了吧，别人的软件帮你找回了你最重要的数据，如果是万兴的年费版的话才99块钱，难道你最重要的数据连 99 块钱都不值？

最后需要注意的几个小问题

如果是误删和“快速格式化”的话，找回来的几率都还比较大
如果是复写性质的格式化，那基本上也就别想恢复的事儿了
即使数据恢复回来了，通常情况下文件名也都彻底乱掉了
如果误删或者格式化之后又写入过文件，写的越多越没戏
如果你有 100 个文件，恢复率 99% 的话可能会丢一个
如果 100 个文件压缩保存，恢复率 99% 的话就彻底废了

最后的最后还有嘿嘿，如果你想要彻底毁掉你的硬盘，不想给别人拿着你硬盘恢复数据的机会的话

格式化的时候不要选择“快速格式化”
使用专门的工具全盘复写几次
上一条做不到的话就往磁盘里塞电影，塞满删掉塞满删掉连续个三四次

（毕竟你卖二手电脑，二手相机的时候肯定不会想成为下一个冠希哥吧

好了，我能想到的就只有这些内容了，最后希望大家永远永远永远不会用到这里面数据恢复相关的经验～

Linux 中不那么基础的权限

发表于 2021-06-02 更新于 2023-07-09

0X00 前言

首先声明这篇博客针对的是中级 Linux 用户，如果你还不清楚 Linux 中的基本权限机制 user/group/other 和 rwx 的话需要先去了解一下对应的基础内容才行。既然标题上写了是“不那么基础的权限”，也就能看出来虽然内容不是很基础，但是也不会很高深。

另外，这篇博客里提到的好多内容都是并不复杂的东西，但是非常零碎，也许你用了十年 Linux 还是不知道其中的一些小知识点，不过也没什么，毕竟这些知识点的使用率真的很低。

如果你看完了这篇博客有那么一点点收获，那我也算是完成目标了；如果你看完后发现所有的内容都是你以前就知道的，那我只能说你对 Linux 权限这部分的掌握超过了大多数人。因为我确实给周围好多人分享过这些内容，从刚实习的朋友到比我工作经历多很多综合实力也强很多的人，几乎没有谁是完全了解这些内容的。（所以说虽然这篇博客并不难，并不是什么高深的知识，但是我比较有信息让你从中获得那么一点点的收获）

本博客不涉及某个命令的具体用法，只起到一个让你“知道自己哪里不知道”的作用。如果想要仔细了解某个命令或者某个机制，可以自行搜索相关资料。

0X01 root 究竟是谁

“root是谁？”这个问题听起来很蠢，但是实际上好多人并没有思考过这个问题。我们都知道 Linux 中有一个叫做 uid 的东西，其实 root 用户指的就是 uid为0的用户，而非用户名为root的用户，我们可以通过 id 命令来查看用户的 uid。

而且值得注意的一点是 uid 是会被回收利用的。也就是说你创建了一个用户，系统分配了 1002 这个 uid 后，如果删掉这个用户紧接着再创建一个新用户是会敷用 1002 这个 uid 的。假设你删掉了系统中的一个老用户，又创建了个新的用户，那么万一 uid 是重复的就有可能导致这个新用户拥有之前老用户的权限，这是一种很危险的操作。

阅读全文 »