yakumo_izuru/aya: vendor/gopkg.in/yaml.v2/readerc.go annotate

annotate vendor/gopkg.in/yaml.v2/readerc.go @ 68:4b79810863f6 draft

Ready to release 0.6.0 Signed-off-by: Izuru Yakumo <yakumo.izuru@chaotic.ninja>

author	yakumo.izuru
date	Wed, 13 Sep 2023 10:49:50 +0000
parents	787b5ee0289d
children

rev	line source
66 787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	1 package yaml
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	2
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	3 import (
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	4 "io"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	5 )
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	6
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	7 // Set the reader error and return 0.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	8 func yaml_parser_set_reader_error(parser *yaml_parser_t, problem string, offset int, value int) bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	9 parser.error = yaml_READER_ERROR
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	10 parser.problem = problem
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	11 parser.problem_offset = offset
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	12 parser.problem_value = value
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	13 return false
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	14 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	15
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	16 // Byte order marks.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	17 const (
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	18 bom_UTF8 = "\xef\xbb\xbf"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	19 bom_UTF16LE = "\xff\xfe"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	20 bom_UTF16BE = "\xfe\xff"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	21 )
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	22
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	23 // Determine the input stream encoding by checking the BOM symbol. If no BOM is
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	24 // found, the UTF-8 encoding is assumed. Return 1 on success, 0 on failure.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	25 func yaml_parser_determine_encoding(parser *yaml_parser_t) bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	26 // Ensure that we had enough bytes in the raw buffer.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	27 for !parser.eof && len(parser.raw_buffer)-parser.raw_buffer_pos < 3 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	28 if !yaml_parser_update_raw_buffer(parser) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	29 return false
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	30 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	31 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	32
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	33 // Determine the encoding.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	34 buf := parser.raw_buffer
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	35 pos := parser.raw_buffer_pos
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	36 avail := len(buf) - pos
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	37 if avail >= 2 && buf[pos] == bom_UTF16LE[0] && buf[pos+1] == bom_UTF16LE[1] {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	38 parser.encoding = yaml_UTF16LE_ENCODING
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	39 parser.raw_buffer_pos += 2
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	40 parser.offset += 2
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	41 } else if avail >= 2 && buf[pos] == bom_UTF16BE[0] && buf[pos+1] == bom_UTF16BE[1] {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	42 parser.encoding = yaml_UTF16BE_ENCODING
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	43 parser.raw_buffer_pos += 2
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	44 parser.offset += 2
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	45 } else if avail >= 3 && buf[pos] == bom_UTF8[0] && buf[pos+1] == bom_UTF8[1] && buf[pos+2] == bom_UTF8[2] {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	46 parser.encoding = yaml_UTF8_ENCODING
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	47 parser.raw_buffer_pos += 3
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	48 parser.offset += 3
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	49 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	50 parser.encoding = yaml_UTF8_ENCODING
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	51 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	52 return true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	53 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	54
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	55 // Update the raw buffer.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	56 func yaml_parser_update_raw_buffer(parser *yaml_parser_t) bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	57 size_read := 0
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	58
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	59 // Return if the raw buffer is full.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	60 if parser.raw_buffer_pos == 0 && len(parser.raw_buffer) == cap(parser.raw_buffer) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	61 return true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	62 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	63
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	64 // Return on EOF.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	65 if parser.eof {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	66 return true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	67 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	68
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	69 // Move the remaining bytes in the raw buffer to the beginning.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	70 if parser.raw_buffer_pos > 0 && parser.raw_buffer_pos < len(parser.raw_buffer) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	71 copy(parser.raw_buffer, parser.raw_buffer[parser.raw_buffer_pos:])
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	72 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	73 parser.raw_buffer = parser.raw_buffer[:len(parser.raw_buffer)-parser.raw_buffer_pos]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	74 parser.raw_buffer_pos = 0
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	75
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	76 // Call the read handler to fill the buffer.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	77 size_read, err := parser.read_handler(parser, parser.raw_buffer[len(parser.raw_buffer):cap(parser.raw_buffer)])
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	78 parser.raw_buffer = parser.raw_buffer[:len(parser.raw_buffer)+size_read]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	79 if err == io.EOF {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	80 parser.eof = true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	81 } else if err != nil {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	82 return yaml_parser_set_reader_error(parser, "input error: "+err.Error(), parser.offset, -1)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	83 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	84 return true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	85 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	86
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	87 // Ensure that the buffer contains at least `length` characters.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	88 // Return true on success, false on failure.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	89 //
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	90 // The length is supposed to be significantly less that the buffer size.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	91 func yaml_parser_update_buffer(parser *yaml_parser_t, length int) bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	92 if parser.read_handler == nil {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	93 panic("read handler must be set")
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	94 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	95
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	96 // [Go] This function was changed to guarantee the requested length size at EOF.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	97 // The fact we need to do this is pretty awful, but the description above implies
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	98 // for that to be the case, and there are tests
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	99
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	100 // If the EOF flag is set and the raw buffer is empty, do nothing.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	101 if parser.eof && parser.raw_buffer_pos == len(parser.raw_buffer) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	102 // [Go] ACTUALLY! Read the documentation of this function above.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	103 // This is just broken. To return true, we need to have the
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	104 // given length in the buffer. Not doing that means every single
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	105 // check that calls this function to make sure the buffer has a
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	106 // given length is Go) panicking; or C) accessing invalid memory.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	107 //return true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	108 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	109
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	110 // Return if the buffer contains enough characters.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	111 if parser.unread >= length {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	112 return true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	113 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	114
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	115 // Determine the input encoding if it is not known yet.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	116 if parser.encoding == yaml_ANY_ENCODING {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	117 if !yaml_parser_determine_encoding(parser) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	118 return false
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	119 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	120 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	121
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	122 // Move the unread characters to the beginning of the buffer.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	123 buffer_len := len(parser.buffer)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	124 if parser.buffer_pos > 0 && parser.buffer_pos < buffer_len {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	125 copy(parser.buffer, parser.buffer[parser.buffer_pos:])
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	126 buffer_len -= parser.buffer_pos
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	127 parser.buffer_pos = 0
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	128 } else if parser.buffer_pos == buffer_len {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	129 buffer_len = 0
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	130 parser.buffer_pos = 0
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	131 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	132
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	133 // Open the whole buffer for writing, and cut it before returning.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	134 parser.buffer = parser.buffer[:cap(parser.buffer)]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	135
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	136 // Fill the buffer until it has enough characters.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	137 first := true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	138 for parser.unread < length {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	139
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	140 // Fill the raw buffer if necessary.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	141 if !first \|\| parser.raw_buffer_pos == len(parser.raw_buffer) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	142 if !yaml_parser_update_raw_buffer(parser) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	143 parser.buffer = parser.buffer[:buffer_len]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	144 return false
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	145 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	146 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	147 first = false
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	148
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	149 // Decode the raw buffer.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	150 inner:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	151 for parser.raw_buffer_pos != len(parser.raw_buffer) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	152 var value rune
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	153 var width int
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	154
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	155 raw_unread := len(parser.raw_buffer) - parser.raw_buffer_pos
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	156
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	157 // Decode the next character.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	158 switch parser.encoding {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	159 case yaml_UTF8_ENCODING:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	160 // Decode a UTF-8 character. Check RFC 3629
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	161 // (http://www.ietf.org/rfc/rfc3629.txt) for more details.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	162 //
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	163 // The following table (taken from the RFC) is used for
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	164 // decoding.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	165 //
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	166 // Char. number range \| UTF-8 octet sequence
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	167 // (hexadecimal) \| (binary)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	168 // --------------------+------------------------------------
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	169 // 0000 0000-0000 007F \| 0xxxxxxx
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	170 // 0000 0080-0000 07FF \| 110xxxxx 10xxxxxx
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	171 // 0000 0800-0000 FFFF \| 1110xxxx 10xxxxxx 10xxxxxx
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	172 // 0001 0000-0010 FFFF \| 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	173 //
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	174 // Additionally, the characters in the range 0xD800-0xDFFF
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	175 // are prohibited as they are reserved for use with UTF-16
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	176 // surrogate pairs.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	177
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	178 // Determine the length of the UTF-8 sequence.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	179 octet := parser.raw_buffer[parser.raw_buffer_pos]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	180 switch {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	181 case octet&0x80 == 0x00:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	182 width = 1
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	183 case octet&0xE0 == 0xC0:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	184 width = 2
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	185 case octet&0xF0 == 0xE0:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	186 width = 3
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	187 case octet&0xF8 == 0xF0:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	188 width = 4
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	189 default:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	190 // The leading octet is invalid.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	191 return yaml_parser_set_reader_error(parser,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	192 "invalid leading UTF-8 octet",
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	193 parser.offset, int(octet))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	194 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	195
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	196 // Check if the raw buffer contains an incomplete character.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	197 if width > raw_unread {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	198 if parser.eof {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	199 return yaml_parser_set_reader_error(parser,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	200 "incomplete UTF-8 octet sequence",
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	201 parser.offset, -1)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	202 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	203 break inner
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	204 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	205
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	206 // Decode the leading octet.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	207 switch {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	208 case octet&0x80 == 0x00:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	209 value = rune(octet & 0x7F)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	210 case octet&0xE0 == 0xC0:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	211 value = rune(octet & 0x1F)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	212 case octet&0xF0 == 0xE0:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	213 value = rune(octet & 0x0F)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	214 case octet&0xF8 == 0xF0:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	215 value = rune(octet & 0x07)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	216 default:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	217 value = 0
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	218 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	219
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	220 // Check and decode the trailing octets.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	221 for k := 1; k < width; k++ {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	222 octet = parser.raw_buffer[parser.raw_buffer_pos+k]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	223
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	224 // Check if the octet is valid.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	225 if (octet & 0xC0) != 0x80 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	226 return yaml_parser_set_reader_error(parser,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	227 "invalid trailing UTF-8 octet",
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	228 parser.offset+k, int(octet))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	229 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	230
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	231 // Decode the octet.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	232 value = (value << 6) + rune(octet&0x3F)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	233 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	234
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	235 // Check the length of the sequence against the value.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	236 switch {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	237 case width == 1:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	238 case width == 2 && value >= 0x80:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	239 case width == 3 && value >= 0x800:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	240 case width == 4 && value >= 0x10000:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	241 default:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	242 return yaml_parser_set_reader_error(parser,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	243 "invalid length of a UTF-8 sequence",
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	244 parser.offset, -1)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	245 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	246
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	247 // Check the range of the value.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	248 if value >= 0xD800 && value <= 0xDFFF \|\| value > 0x10FFFF {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	249 return yaml_parser_set_reader_error(parser,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	250 "invalid Unicode character",
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	251 parser.offset, int(value))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	252 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	253
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	254 case yaml_UTF16LE_ENCODING, yaml_UTF16BE_ENCODING:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	255 var low, high int
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	256 if parser.encoding == yaml_UTF16LE_ENCODING {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	257 low, high = 0, 1
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	258 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	259 low, high = 1, 0
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	260 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	261
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	262 // The UTF-16 encoding is not as simple as one might
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	263 // naively think. Check RFC 2781
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	264 // (http://www.ietf.org/rfc/rfc2781.txt).
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	265 //
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	266 // Normally, two subsequent bytes describe a Unicode
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	267 // character. However a special technique (called a
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	268 // surrogate pair) is used for specifying character
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	269 // values larger than 0xFFFF.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	270 //
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	271 // A surrogate pair consists of two pseudo-characters:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	272 // high surrogate area (0xD800-0xDBFF)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	273 // low surrogate area (0xDC00-0xDFFF)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	274 //
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	275 // The following formulas are used for decoding
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	276 // and encoding characters using surrogate pairs:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	277 //
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	278 // U = U' + 0x10000 (0x01 00 00 <= U <= 0x10 FF FF)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	279 // U' = yyyyyyyyyyxxxxxxxxxx (0 <= U' <= 0x0F FF FF)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	280 // W1 = 110110yyyyyyyyyy
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	281 // W2 = 110111xxxxxxxxxx
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	282 //
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	283 // where U is the character value, W1 is the high surrogate
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	284 // area, W2 is the low surrogate area.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	285
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	286 // Check for incomplete UTF-16 character.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	287 if raw_unread < 2 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	288 if parser.eof {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	289 return yaml_parser_set_reader_error(parser,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	290 "incomplete UTF-16 character",
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	291 parser.offset, -1)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	292 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	293 break inner
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	294 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	295
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	296 // Get the character.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	297 value = rune(parser.raw_buffer[parser.raw_buffer_pos+low]) +
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	298 (rune(parser.raw_buffer[parser.raw_buffer_pos+high]) << 8)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	299
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	300 // Check for unexpected low surrogate area.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	301 if value&0xFC00 == 0xDC00 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	302 return yaml_parser_set_reader_error(parser,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	303 "unexpected low surrogate area",
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	304 parser.offset, int(value))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	305 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	306
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	307 // Check for a high surrogate area.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	308 if value&0xFC00 == 0xD800 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	309 width = 4
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	310
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	311 // Check for incomplete surrogate pair.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	312 if raw_unread < 4 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	313 if parser.eof {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	314 return yaml_parser_set_reader_error(parser,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	315 "incomplete UTF-16 surrogate pair",
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	316 parser.offset, -1)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	317 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	318 break inner
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	319 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	320
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	321 // Get the next character.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	322 value2 := rune(parser.raw_buffer[parser.raw_buffer_pos+low+2]) +
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	323 (rune(parser.raw_buffer[parser.raw_buffer_pos+high+2]) << 8)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	324
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	325 // Check for a low surrogate area.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	326 if value2&0xFC00 != 0xDC00 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	327 return yaml_parser_set_reader_error(parser,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	328 "expected low surrogate area",
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	329 parser.offset+2, int(value2))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	330 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	331
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	332 // Generate the value of the surrogate pair.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	333 value = 0x10000 + ((value & 0x3FF) << 10) + (value2 & 0x3FF)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	334 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	335 width = 2
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	336 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	337
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	338 default:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	339 panic("impossible")
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	340 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	341
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	342 // Check if the character is in the allowed range:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	343 // #x9 \| #xA \| #xD \| [#x20-#x7E] (8 bit)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	344 // \| #x85 \| [#xA0-#xD7FF] \| [#xE000-#xFFFD] (16 bit)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	345 // \| [#x10000-#x10FFFF] (32 bit)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	346 switch {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	347 case value == 0x09:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	348 case value == 0x0A:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	349 case value == 0x0D:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	350 case value >= 0x20 && value <= 0x7E:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	351 case value == 0x85:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	352 case value >= 0xA0 && value <= 0xD7FF:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	353 case value >= 0xE000 && value <= 0xFFFD:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	354 case value >= 0x10000 && value <= 0x10FFFF:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	355 default:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	356 return yaml_parser_set_reader_error(parser,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	357 "control characters are not allowed",
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	358 parser.offset, int(value))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	359 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	360
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	361 // Move the raw pointers.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	362 parser.raw_buffer_pos += width
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	363 parser.offset += width
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	364
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	365 // Finally put the character into the buffer.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	366 if value <= 0x7F {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	367 // 0000 0000-0000 007F . 0xxxxxxx
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	368 parser.buffer[buffer_len+0] = byte(value)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	369 buffer_len += 1
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	370 } else if value <= 0x7FF {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	371 // 0000 0080-0000 07FF . 110xxxxx 10xxxxxx
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	372 parser.buffer[buffer_len+0] = byte(0xC0 + (value >> 6))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	373 parser.buffer[buffer_len+1] = byte(0x80 + (value & 0x3F))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	374 buffer_len += 2
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	375 } else if value <= 0xFFFF {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	376 // 0000 0800-0000 FFFF . 1110xxxx 10xxxxxx 10xxxxxx
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	377 parser.buffer[buffer_len+0] = byte(0xE0 + (value >> 12))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	378 parser.buffer[buffer_len+1] = byte(0x80 + ((value >> 6) & 0x3F))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	379 parser.buffer[buffer_len+2] = byte(0x80 + (value & 0x3F))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	380 buffer_len += 3
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	381 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	382 // 0001 0000-0010 FFFF . 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	383 parser.buffer[buffer_len+0] = byte(0xF0 + (value >> 18))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	384 parser.buffer[buffer_len+1] = byte(0x80 + ((value >> 12) & 0x3F))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	385 parser.buffer[buffer_len+2] = byte(0x80 + ((value >> 6) & 0x3F))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	386 parser.buffer[buffer_len+3] = byte(0x80 + (value & 0x3F))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	387 buffer_len += 4
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	388 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	389
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	390 parser.unread++
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	391 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	392
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	393 // On EOF, put NUL into the buffer and return.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	394 if parser.eof {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	395 parser.buffer[buffer_len] = 0
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	396 buffer_len++
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	397 parser.unread++
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	398 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	399 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	400 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	401 // [Go] Read the documentation of this function above. To return true,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	402 // we need to have the given length in the buffer. Not doing that means
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	403 // every single check that calls this function to make sure the buffer
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	404 // has a given length is Go) panicking; or C) accessing invalid memory.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	405 // This happens here due to the EOF above breaking early.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	406 for buffer_len < length {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	407 parser.buffer[buffer_len] = 0
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	408 buffer_len++
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	409 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	410 parser.buffer = parser.buffer[:buffer_len]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	411 return true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	412 }

Mercurial > yakumo_izuru > aya

annotate vendor/gopkg.in/yaml.v2/readerc.go @ 68:4b79810863f6 draft