MySQL长文本字段的选取

某个字段需要存储 长文本类型的数据,长度可变,范围不清.

varchar最多能存储多大长度呢? 何种情况下用text更好?

以下内容就为探究这个问题:



<1>.先将content字段设为varchar(255),则此字段只能最多存储255个字符数


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
package main

import "fmt"

func main() {

var str string

for i := 1; i <= 255; i++ {
str += "a"
}

fmt.Println(str)

fmt.Println(len(str))

}
1
2
3
4
输出为:
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

255

将生成的255位的str,写入content字段,成功保存. 且与文本是 数字,英文 还是中文,全角还是半角无关.(自MySQL 5.0之后)


但如果写入更长的数据,则会从第255位开始,之后的都舍弃.

baaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa (还是255位,舍弃最后一个a) 可以写入,

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaac (256位),无法写入


<2>.varchar类型的上限是 最多能存储65535个字节的数据(而不是字符; 即64KB),因而其上限和字符集有关,如果是latin1,则可以表示65532长度的字符数 (变长字段额外使用1或2个字节来记录实际数据长度、以及是否为NULL标识位,如果数据表只有一个varchar字段且该字段DEFAULT NULL,那么该varchar字段的最大长度为65532个字节,即65535-2-1=65532 byte)

字符集为utf-8时,则最多存 $65532/3=21844$个字符数,

尝试将content自动改为varchar(21844),报错如下:

1
ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. You have to change some columns to TEXT or BLOBs。

这是因为不仅受 存储限制,编码长度限制,还受到mysql单行长度限制,mysql一行记录所有长度不得超过65535。若定义的表中各字段长度超过这个值,则提示如上错误.

因为这张表还有一个int(11)类型的id,故而达不到21844这个长度.


将id字段删掉,只保留content这一个字段,在utf-8下,可成功设置为 varchar(21844),

如改为varchar(21845),则会继续报如上错误.


<3>.如果继续以较大幅度提供后面的值,如 varchar(70000),则不会报错而将自动转为mediumtext类型.


如将该字段字符集(及其相应的排序规则)改为latin1,则可成功设置为varchar(65532)

如再提高至varchar(65533),则会报上面行大小太大的错误.

latin1字符集下,存储英文大小写,数字,都没有问题,但用来存储汉字,则会因为不能识别而被记录为?


<4.>在在utf-8下, 且只有这一个字段,可成功设置为varchar(21844)情况下,经实际亲测,可以容纳21844个字符,超出部分将会被舍弃.




即一般情况下,如果长度小于2万,可用varchar,否则就要用text



参考 & 强烈推荐阅读

MySQL中varchar最大长度是多少?

MySQL性能优化之char、varchar、text的区别



对于int了tinyint了这些MySql类型,后面那个4或者11没啥实际意义,只是说(当位数不足时)前面填充多少个0,然后使之变为4位或者11位,对这个类型的字段实际能存的长度没啥影响.

即占据1个Byte的tinyint类型,最多就能表征256个不同值. 可以表征无符号的连续数字0-255,或者有符号的数字-128到127.

char类型括号里的数字和tinyint/int差不多;

而varchar不同,括号里的这个数字确实有实际意义,可以指定其最大能存多少,其所谓”可变”,也就是在这里.即varchar这个类型能存的最大长度,根据后面括号里的这个数值而变.

且自MySql 5.0后,这个数字指”字符”,而不再是”字节”,即对一个varchar(6),存”张三李四王五”没问题,但”1234567”或”abcdefg”,则会溢出.


同事让我执行sql语句,为某张表增加一个ip字段,类型为varchar(16),对于IPV4的地址,类似 255.255.255.255,至多占用15个字符,是够用的

但是还有IPV6的地址,类似 2001:0db8:85a3:0000:0000:8a2e:0370:7334,varchar(16)就放不下了, 又让改成了varchar(40)

但实际上,varchar(16)和varchar(40),在所存数据一样,比如都存很少的字符时,所占用的空间是一样的,并不能够省空间.

可以记住:低于255个字符的,无脑varchar(255)就行了

mysql的varchar类型,设置了40个字符,如果实际都没超过16,实际占用的空间是多少?

在 MySQL 中,VARCHAR 类型是一个变长字符串数据类型。当你为一个 VARCHAR 字段指定了最大长度为 40 个字符时,这意味着该字段可以存储最多 40 个字符。不过,实际存储所需的空间取决于实际存储的内容。

MySQL VARCHAR 类型的存储需求由以下两部分组成:

  1. 字符数据的长度:存储实际字符所需的空间。
  2. 长度前缀:一个或两个字节,用于表示数据的长度。

对于 VARCHAR 字段,MySQL 使用 1 个字节来存储长度,如果长度小于等于 255。如果长度超过 255,那么使用 2 个字节来存储长度。

因此,对于最大长度为 40 个字符的 VARCHAR 字段:

  • 如果存储的数据没有超过 16 个字符,那么实际的存储空间将是这 16 个字符所需的空间加上 1 个字节的长度前缀。
  • 字符所需的空间取决于字符集。例如,对于 UTF-8 字符集,一个字符可能需要最多 3 个字节的空间。因此,如果所有字符都是单字节字符(如 ASCII 字符),那么 16 个字符将占用 16 个字节。

综上所述,对于一个未超过 16 个字符的 VARCHAR(40) 字段:

  • 如果使用的是单字节字符集(如 ASCII),那么实际占用的空间将是 17 个字节(16 个字节的字符数据 + 1 个字节的长度前缀)。
  • 如果使用的是多字节字符集(如 UTF-8),那么实际占用的空间可能会更多,取决于实际存储的字符。

对于varchar(40)和varchar(16),如果存储的内容只占了2个字符,两种存储类型占用的实际空间一致吗?前者会比后者更多吗?

在 MySQL 中,对于 VARCHAR(40)VARCHAR(16) 类型,如果存储的内容只占用了 2 个字符,那么这两种存储类型占用的实际空间是一致的。这是因为 VARCHAR 类型的存储需求主要取决于实际存储的内容长度,而不是字段的最大长度设置。

VARCHAR 字段的存储空间由两部分组成:

  1. 字符数据长度:即实际存储的字符所占用的空间。
  2. 长度前缀:用于表示数据长度的字节。MySQL 使用 1 个字节存储长度,如果字段的最大长度是 255 或更小;如果最大长度超过 255,则使用 2 个字节。

在你的例子中,无论是 VARCHAR(40) 还是 VARCHAR(16),由于存储的内容只有 2 个字符,且这两个字段的最大长度都小于 255,所以长度前缀都只占用 1 个字节。因此,对于两个字符的存储:

  • 如果字符是单字节的(例如,使用的是 ASCII 字符集),那么每个 VARCHAR 字段将占用 3 个字节(2 个字节的字符数据 + 1 个字节的长度前缀)。
  • 如果字符是多字节的(例如,使用 UTF-8 字符集),实际占用的空间取决于字符的具体编码,但对于 VARCHAR(40)VARCHAR(16) 来说,它们仍然是相同的。

总的来说,对于实际存储的内容长度相同的情况,不同最大长度的 VARCHAR 字段占用的实际空间是一样的。

如果是varchar(400)和varchar(16),如果存储的内容都只占了2个字符,两种存储类型占用的实际空间一致吗?前者会比后者更多吗?

对于 VARCHAR(400)VARCHAR(16) 的情况,当存储的内容都只占用 2 个字符时,两种存储类型占用的实际空间并不一致。

在 MySQL 中,VARCHAR 类型的长度前缀取决于字段的最大长度:

  • 对于最大长度小于等于 255 的 VARCHAR 字段,MySQL 使用 1 个字节来存储长度信息。
  • 对于最大长度超过 255 的 VARCHAR 字段,MySQL 使用 2 个字节来存储长度信息。

因此,对于 VARCHAR(400) 字段,由于最大长度超过了 255,MySQL 将使用 2 个字节来存储长度信息。而对于 VARCHAR(16) 字段,MySQL 只需使用 1 个字节来存储长度信息。

所以,如果存储的内容都只占用了 2 个字符:

  • VARCHAR(16) 字段中,实际占用的空间将是 3 个字节(2 个字节的字符数据 + 1 个字节的长度前缀)。
  • VARCHAR(400) 字段中,实际占用的空间将是 4 个字节(2 个字节的字符数据 + 2 个字节的长度前缀)。

因此,在这种情况下,VARCHAR(400) 字段会比 VARCHAR(16) 字段占用更多的空间。