你好,我是吴咏炜。

这一讲,我们会讨论 Vim 的基本概念和配置。先强调一下,请务必确保你在学习这一讲之前,已经通过 Vim 教程熟悉了 Vim 的基本用法。

Vim 教程的内容概要

上节课我给你留的作业,就是花时间学习一下 Vim 教程,下面我们就来检验一下。只有你自己先对照着教程操作了一遍,今天我再带着你过一遍里面的基本概念和配置,你才能查漏补缺,发现自己遇到的问题,明确自己需要多加练习的地方。

好,现在请查看下面的键盘图。简单说明一下,这张图上展示了一个键盘。图中的“•”表示,单个字母不是完整的命令,必须再有进一步的输入。比如,单个“g”没有意义,而“gg”表示跳转到文件开头。(对于命令后面明确跟一个动作的,如“c”,我们不使用“•”。)一个键最多有三排内容:最底下是直接按键的结果,中间是按下 Shift 的结果(变大写),上面偏右的小字是按下 Ctrl 的结果。我们还用了一些特殊符号来表示操作的位置,如果你已经了解了这些命令的功能,你也自然就明白它们的意义了。

Vim 命令速查(教程版)

请检查一下有颜色的那些键,看看你是否有任何不熟悉的地方。如果看下来有让你感到陌生的内容,请复习 Vim 教程。

这张图里没有写出 Vim 的命令行命令。你现在应该已经掌握了以下这些:

  1. “:q!”:退出 Vim
  2. “:wq”:存盘退出
  3. “:s”:执行替换
  4. “:!”:执行外部命令
  5. “:edit”(一般缩写为“:e”):编辑文件
  6. “:w”:写文件
  7. “:r”:读文件
  8. “:help”:查看帮助
  9. 使用键 Ctrl-D 和 Tab 来进行命令行补全

同样,如果你发现上面列举的命令有你不熟悉的,也请重新打开 Vim 教程复习一下——这些属于 Vim 的最基本功能,一定要能熟练运用才行。

Vim 的模式

接下来我们进入本讲的正题,讲述 Vim 的四种主要模式、键描述的体例和 Vim 需要的基本配置选项。掌握了这些内容之后,我们就能应对基本的编辑任务了。下面我们一一来看。

Vim 最特别的地方就是它的模式了。与其他大部分编辑器不同,进入 Vim 后,缺省状态下键入的字符并不会插入到所编辑的文件之中。Vim 的模式(mode,可以简单地理解为“状态”)是它的麻烦所在,但同时也是它的威力所在。

我们需要知道,Vim 有以下四种主要模式:

  1. 正常(normal)模式(也称为普通模式),缺省的编辑模式;如果不加特殊说明,一般提到的命令都直接在正常模式下输入;在任何其他模式中,都可以通过键盘上的 Esc 键回到正常模式。
  2. 插入(insert)模式,输入文本时使用;比如在正常模式下键入 i(insert)或 a(append)即可进入插入模式。
  3. 可视(visual)模式,用于选定文本块;教程中已经提到可以用键 v(小写)来按字符选定,Vim 里也提供其他不同的选定方法,包括按行和按列块。
  4. 命令行(command-line)模式,用于执行较长、较复杂的命令;在正常模式下键入冒号(:)即可进入该模式;使用斜杠(/)和问号(?)开始搜索也算作命令行模式。命令行模式下的命令要输入回车键(Enter)才算完成。

此外,Vim 也有个选择(select)模式,与普通的 Windows 编辑器行为较为接近,选择内容后再输入任何内容,将会替换选择的内容。在以可视模式和选择模式之一选定文本块之后,可以使用 Ctrl-G 切换到另一模式。这个模式主要是为了模拟 Windows 编辑器的行为,并不是 Vim 的主要用法,使用它反而会给 Vim 里的自动化带来麻烦,所以我们也就不多作介绍了。

关于 Vim 的模式,我们重点掌握正常模式就可以了,刚刚也说过,Vim 里的大部分操作会在正常模式下完成。如果你做编辑工作时有超过几秒的停顿,就应当考虑按下 Esc 键,回到正常模式。记住,正常模式就是正常情况下你应当处于的模式。😄

Vim 的键描述体例

清楚了 Vim 模式之后,我们来对 Vim 里的按键作一下清晰的体例描述,毕竟,Vim 里的键真的有点多。

从现在开始,我会使用 Vim 里的标准键描述方式来讲解。根据 Vim 的一般习惯,我们使用尖括号来描述特殊的输入序列。下面我会提供一个列表,给出常用键的表示方式及在动图中的显示方式。这部分内容不需要记住,你用的时候作为参考就行。

  1. <Esc> 表示 Esc 键;显示为“⎋”
  2. <CR> 表示回车键;显示为“↩”
  3. <Space> 表示空格键;显示为“␣”
  4. <Tab> 表示 Tab 键;显示为“⇥”
  5. <BS> 表示退格键;显示为“⌫”
  6. <Del> 表示删除键;显示为“⌦”
  7. <lt> 表示 < 键;显示为“<”
  8. <Up> 表示光标上移键;显示为“⇡”
  9. <Down> 表示光标下移键;显示为“⇣”
  10. <Left> 表示光标左移键;显示为“⇠”
  11. <Right> 表示光标右移键;显示为“⇢”
  12. <PageUp> 表示 Page Up 键;显示为“⇞”
  13. <PageDown> 表示 Page Down 键;显示为“⇟”
  14. <Home> 表示 Home 键;显示为“↖”
  15. <End> 表示 End 键;显示为“↘”
  16. <F1> - <F12> 表示功能键 1 到 12;显示为“F1”到“F12”
  17. <S-…> Shift 组合键;显示为“⇧”(较少使用,因为我们需要写 ! 而不是 <S-1>;和特殊键组合时仍然有用)
  18. <C-…> Control 组合键;显示为“⌃”
  19. <M-…> Alt 组合键;显示为“⌥”(对于大部分用户,它的原始键名 Meta 应该只具有历史意义)
  20. <D-…> Command 组合键;显示为“⌘”(Mac 键盘)

现在回到前面的模式部分,我们提到的 Esc、Enter、v、V 和 Ctrl-V,按我们现在的描述惯例,以后就会写成 <Esc><CR>vV<C-V>。这也是以后在 Vim 里对键进行重映射的写法——如果你还不了解重映射是什么也没关系,我们很快就会讨论到。

这里我要强调一下,对“<”的特殊解释仅在描述输入时生效。在描述命令行和代码时,我们写“<CR>”仍表示四个字符,而非回车键。特别是,如果我们描述的命令行首是“:”,表示这是一个输入 : 开始的 Vim 命令行模式命令(以回车键结束);如果行首是“/”或“?”,表示这是一个输入 /? 开始的搜索命令(以回车键结束);如果行首是“$”,表示这是一个在 shell 命令行上输入的命令(以回车键结束),“$”(和后面的空格)不是命令的一部分,通常后续行也不是命令的一部分,除非行尾有“\”或“^”字符,或行首有“$”字符。

也就是说,下面的命令是在 Vim 里输入“:set ft?<CR>”(用来显示当前编辑文件的文件类型):

:set ft?

Vim 命令示例

下面的命令则是在 shell 里输入“which vim<CR>”(用来检查 vim 命令的位置):

$ which vim
/usr/bin/vim

Shell 命令示例

此外,当我用“:help”描述帮助命令时,你不仅可以在 Vim 里输入这个命令来得到帮助,也可以点击这个帮助的链接,直接在线查看相应的中文帮助页面。

Vim 的内置帮助功能

这节内容不需要死记。建议使用“收藏”功能,这样,你可以在以后碰到不认识的符号标记的时候,返回来查看这一节的内容。

Vim 的选项和配置

了解了 Vim 模式和键描述,我们对 Vim 的认识又多了一些,第一步的学习成就达成。要想更好地使用 Vim,下一个关键点就是配置了,接下来我就带你看看 Vim 配置都有哪些需要注意的点。

作为一个可以越用越顺手的应用程序,Vim 是需要配置的。我们才刚开始学习,所以目前我们的配置文件是相当简单的,但随着课程的进展和你使用 Vim 越来越多,你的 Vim 配置文件必然会越变越复杂。我们今天就先来做一些初步的讨论,看看能实际使用的一个最基本 Vim 配置文件是什么样子。

我们上节课已经讨论过,根据 Unix 下的惯例,Vim 的配置文件放在用户的主目录下,文件名通常是 .vimrc;而它在 Windows 下名字是 _vimrc。我们前面给出最基本的配置文件是这个样子的:

set enc=utf-8
set nocompatible
source $VIMRUNTIME/vimrc_example.vim

如果你熟悉 shell 语法,你肯定能看到不少熟悉的影子在里面。这三行完成了下列功能:

  1. 设置编辑文件的内码是 UTF-8(非所有平台缺省,但为编辑多语言文件所必需)
  2. 设置 Vim 不需要和 vi 兼容(仅为万一起见,目前大部分情况下这是缺省情况)
  3. 导入 Vim 的示例配置(这会打开一些有用的选项,如语法加亮、搜索加亮、命令历史、记住上次的文件位置,等等)

对于现代 Unix 系统上的 Vim 8,实际上只需要最后一句就足够了。对于现代 Windows 系统上的 Vim 8,中间的这句 set nocompatible 也可以删除。如果你在较老的 Vim 版本上进行配置,那么把这三行全放进去会比较安全。

接下来,我会讲一些基本的配置项,保证你的日常工作流顺畅。它们是:备份和跨会话撤销、鼠标支持、中文支持及图形界面的字体支持。除了字体支持主要牵涉到美观性,其他三项都是对编辑至关重要的基本功能。我们一一来看。

备份和撤销文件

上面的基本设置会产生一个有人喜欢、但也有很多人感到困惑的结果:你修改文件时会出现结尾为“~”的文件,有文件名后面直接加“~”的,还有前面加“.”后面加“.un~”的。这是因为在示例配置里,Vim 自动设置了下面两个选项:

set backup
set undofile

前一个选项使得我们每次编辑会保留上一次的备份文件,后一个选项使得 Vim 在重新打开一个文件时,仍然能够撤销之前的编辑(undo),这就会产生一个保留编辑历史的“撤销文件”(undofile)了。

有撤销文件时,再次打开文件时仍然可以撤销上次的编辑

我的通常做法是,不产生备份文件,但保留跨会话撤销编辑的能力;因为有了撤销文件,备份其实也就没有必要了。同时,把撤销文件放在用户个人的特定目录下,既保证了安全,又免去了其他目录下出现不必要文件的麻烦。

要达到这个目的,我在 Linux/macOS 下会这么写:

set nobackup
set undodir=~/.vim/undodir

在 Windows 下这么写:

set nobackup
set undodir=~\vimfiles\undodir

无论哪种环境,你都需要创建这个目录。我们可以用下面的命令来让 Vim 在启动时自动创建这个目录:

if !isdirectory(&undodir)
call mkdir(&undodir, ‘p’, 0700)
endif

如果我告诉你, &undodir 代表 undodir 这个选项的值,那么其他代码的基本作用,相信你也一定能看出来了吧?我们暂时就不做进一步分析了。如果你好奇的话,可以提前看一下下面各项的 Vim 帮助文档:

  1. :help isdirectory()
  2. :help mkdir()
  3. :help :call

这个跨会话撤销的能力,我还真不知道其他哪个编辑器也有。更妙的是,Vim 还有撤销树的概念,可以帮助你回到任一历史状态。这个我们以后会和相关的插件一起讨论。

鼠标支持

我不知道你会不会像某些资深 Vim 用户一样,只用键盘不用鼠标。我反正是做不到的,也没有动力去那样做——毕竟,浪费计算机界一项伟大的发明并不那么有必要😂。手一直在键盘上的本位排(home row)打字当然会更快,但一个程序员看代码的时间比写代码的时间要多得多,而在非线性的跳转任务上,鼠标比键盘更加快,也更加有效。

在 Vim 的终端使用场景下,鼠标的选择有一定的歧义:你希望是使用 Vim 的可视模式选择内容,并且只能在 Vim 里使用呢,还是产生 Vim 外的操作系统的文本选择,用于跟其他应用程序的交互呢?这是一个基本的使用问题,两种情况都可能发生,都需要照顾。

如果你使用 xterm 兼容终端的话,通常的建议是:

  1. 在不按下修饰键时,鼠标选择产生 Vim 内部的可视选择。
  2. 在按下 Shift 时,鼠标选择产生操作系统的文本选择。

对于不兼容 xterm、不支持对 Shift 键做这样特殊处理的终端,我们一般会采用一种“绕过”方式,让 Vim 在某种情况下暂时不接管鼠标事件。通常的选择是在命令行模式下不使用鼠标。下面,我们就分这两种情况来配置。

虽然最新的 Vim 缺省配置文件(示例配置文件会包含缺省配置),在大部分情况下已经可以自动设置合适的鼠标选项了,不过为照顾我们课程的三种不同平台,我们还是手工设置一下:

if has(‘mouse’)
if has(‘gui_running’) || (&term =~ ‘xterm’ && !has(‘mac’))
set mouse=a
else
set mouse=nvi
endif
endif

上面代码说的是,如果 Vim 有鼠标支持的话,那在以下任一条件满足时:

  1. 图形界面正在运行
  2. 终端是 xterm 兼容,并且不是 Mac(Mac 上的终端声称自己是 xterm,但行为并不完全相同)

我们将启用完全的鼠标支持(mouse=a)。特别是,此时鼠标拖拽就会在 Vim 里使用可视模式选择内容(只能在 Vim 里使用)。而当用户按下 Shift 键时,窗口系统接管鼠标事件,用户可以使用鼠标复制 Vim 窗口里的内容供其他应用程序使用。

否则(非图形界面的的终端,且终端类型不是 xterm),就只在正常模式(n)、可视模式(v)、插入模式(i)中使用鼠标。这意味着,当用户按下 : 键进入命令行模式时,Vim 将不对鼠标进行响应,这时,用户就可以使用鼠标复制 Vim 窗口里的内容到其他应用程序里去了。

可视模式的选取和按“:”后的选取

非 xterm 的鼠标支持在 macOS 和 Windows 下都有效。但在 Windows 下需要注意的一点是,如果使用非图形界面的 Vim 的话,应当在命令提示符(Command Prompt)的属性里关闭“快速编辑模式”(QuickEdit Mode),否则 Vim 在运行时将无法对鼠标事件进行响应。

鉴于命令提示符的行为有很多怪异和不一致之处,强烈建议你在 Windows 下,要么使用图形界面的 Vim,要么使用 Cygwin/MSYS2 里、运行在 mintty 下的 Vim。

中文支持

接下来我和你讲讲中文支持的问题。如果你一直在 UTF-8 下使用中文的话,那这一小节的内容可以跳过。对于大部分在 Unix 下工作的人员,应该是这样的情况。而如果你在 Windows 上工作,或者有需要跟别人交换 GB2312、GBK、GB18030 编码的文本文件,那这部分的内容还是需要看一下的。

完整的 Unicode 历史和原理可以讲上整整一讲,但从实用的角度,我们就简化成下面几条吧:

  1. 整个世界基本上在向 UTF-8 编码靠拢。
  2. 微软由于历史原因,内部使用 UTF-16;UTF-16 可以跟 UTF-8 无损转换。
  3. GB2312、GBK、GB18030 是一系列向后兼容的中文标准编码方式,GB2312 编码的文件是合法的 GBK 文件,GBK 编码的文件是合法的 GB18030 文件。但除了 GB18030,都不能做到跟 UTF-8 无损转换;目前非 UTF-8 的简体中文文本基本上都用 GBK/GB18030 编码(繁体中文文本则以 Big5 居多)。鉴于 GB18030 是国家标准,其他两种编码也和 GB18030 兼容,我们就重点讲如何在 Vim 中支持 GB18030 了。

举一个具体的例子,“你好😄”这个字符串,在 UTF-8 编码下是下面 10 个字节(我按字符进行了分组):

e4bda0 e5a5bd f09f9884

如果使用 GB18030 编码(GB2312/GBK 不能支持表情字符)的话,会编码成 8 个字节:

c4e3 bac3 9439fd30

这么看起来,GB18030 处理中文在存储效率上是优势的。但它也有缺点:

  1. GBK 外的 Unicode 字符一般需要四字节编码(非中文情况会劣化)
  2. GBK 外的 Unicode 字符跟 Unicode 码点需要查表才能转换(UTF-8 则可以用非常简单的条件判断、移位、与、或操作来转换)
  3. 一旦出现文件中有单字节发生损毁,后续的所有中文字符都可能发生紊乱(而 UTF-8 可以在一个字符之后恢复)

因此,GB18030 在国际化的软件中不会作为内码来使用,只会是读取 / 写入文件时使用的转换编码。我们要让 Vim 支持 GB18030 也同样是如此。由于 UTF-8 编码是有明显规律的,并非任意文件都能成功地当成 UTF-8 来解码,我们一般使用的解码顺序是:

  1. 首先,检查文件是不是有 Unicode 的 BOM(字节顺序标记)字符,有的话按照 BOM 字符来转换文件内容。
  2. 其次,检查文件能不能当作 UTF-8 来解码;如果可以,就当作 UTF-8 来解释。
  3. 否则,尝试用 GB18030 来解码;如果能成功,就当作 GB18030 来转换文件内容。
  4. 最后,如果上面的解码都不成功,就按 Latin1 字符集来解码;由于这是单字节的编码,转换必定成功。

事实上,Vim 缺省差不多就是按这样的顺序,但第三步使用何种编码跟系统配置有关。如果你明确需要处理中文,那在配置文件里最好明确写下下面的选项设定:

set fileencodings=ucs-bom,utf-8,gb18030,latin1

图形界面的字体配置

图形界面的 Vim 可以自行配置使用的字体,但在大部分环境里,这只是起到美化作用,而非必需项。不过,对于高分辨率屏幕的 Windows,这是一个必需项:Vim 在 Windows 下缺省使用的不是 TrueType 字体,不进行配置的话,字体会小得没法看。

高分辨率屏下的 Windows 图形界面 Vim

在 Windows 的缺省字体里,一般而言,Consolas 和 Courier New 还比较合适。以 Courier New 为例,在 _vimrc 里可以这样配置(Windows 上的基本写法是字体名称加冒号、“h”加字号;用“_”取代空格,否则空格需要用“\”转义):

if has(‘gui_running’)
set guifont=Courier_New:h10
endif

设置了 10 磅 Consolas 字体的 Vim

字体名称如何写是件平台相关的事(可参见帮助文档“:help gui-font”)。如果你不确定怎么写出你需要的字体配置,或者你怎么写都写不对的话,可以先使用图形界面的菜单来选择(通常是“编辑 > 选择字体”;在 MacVim 里是“Edit > Font > Show Fonts”),然后使用命令“:set guifont?”来查看。

注意,Vim 在设置选项时,空格需要用“\”进行转义。比如,如果我们要在 Ubuntu 下把字体设成 10 磅的 DejaVu Sans Mono,就需要写:

" Linux 和 Windows 不同,不能用 ‘_’ 取代空格
set guifont=DejaVu\ Sans\ Mono\ 10

此外,宽字符字体(对我们来讲,就是中文字体了)是可以单独配置的。这可能就更是一件仁者见仁、智者见智的事了。对于纯中文的操作系统,这一般反而是不需要配置的;但如果你的语言设定里,中文不是第一选择的话,就有可能在显示中文时出现操作系统误用日文字体的情况。这时你会想要手工选择一个中文字体,比如在 Ubuntu 下,可以用:

set guifontwide=Noto\ Sans\ Mono\ CJK\ SC\ 11

注意,在不同的中英文字体搭配时,并不需要字号相同。事实上,在 Windows 和 Linux 上我通常都是使用不同字号的中英文字体的。

Ubuntu 下的 gvim 设置中文字体

在上面的动图中,你可以观察到设了中文字体之后,不仅中文字变大,更美观了,“将”、“适”、“关”、“复”、“启”等字的字形也同时发生了变化。

由于字体在各平台上差异较大,字体配置我就不写到 Vim 的参考配置中去了,只把如何选择和配置的方法写出来供你参考。

内容小结

好了,这一讲我就讲到这里,我们来做个内容小结。

今天我给出了一张键盘图,带你复习了 Vim 教程的内容,这里我要再强调一遍,这部分的内容如果你还有不熟悉的,一定要再去学习一下 Vim 教程,这段时间我们一定要多花点时间和精力来练习,把这一步跨过去。

掌握了 Vim 教程里的基础信息还远远不够,我们还得了解 Vim 的四种主要模式,你只要记住最重要的就是正常模式就可以了。

最后我带你学习了 Vim 的几个基本配置选项,包括对撤销、鼠标、中文和字体的支持,来满足最基本的编辑需要。最终的 Vim 配置文件可以在 GitHub 上找到:

https://github.com/adah1972/geek_time_vim

关于这个配置文件,我这里做个备注说明:主(master)分支可以用在类 Unix 平台上,windows 分支则用在 Windows 上。适用于今天这一讲的内容标签是 l2-unixl2-windows:你可以用 git checkout l2-unixgit checkout l2-windows 来得到相应平台对应本讲的配置文件。

好了,掌握了今天的内容,你就可以用 Vim 做最基本的编辑了。

课后练习

请使用本讲的配置文件,并尝试以下操作:

  1. 退出 Vim 然后重新打开文件,仍然可以撤销上次的编辑。
  2. 使用终端的 Vim,在终端里用鼠标复制 Vim 里的文本到另外一个文本编辑器中(仅 Unix 下,可选)。
  3. 在 Vim 中使用“:help”命令(大部分环境下也可以使用 <F1> 功能键),尝试查看命令说明,以及使用键盘和鼠标在帮助主题中跳转。

如果遇到任何问题,欢迎留言和我讨论。我们下一讲见。