yakumo_izuru/aya: vendor/github.com/dlclark/regexp2/syntax/charclass.go annotate

annotate vendor/github.com/dlclark/regexp2/syntax/charclass.go @ 66:787b5ee0289d draft

Use vendored modules Signed-off-by: Izuru Yakumo <yakumo.izuru@chaotic.ninja>

author	yakumo.izuru
date	Sun, 23 Jul 2023 13:18:53 +0000
parents
children

rev	line source
66 787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	1 package syntax
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	2
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	3 import (
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	4 "bytes"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	5 "encoding/binary"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	6 "fmt"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	7 "sort"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	8 "unicode"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	9 "unicode/utf8"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	10 )
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	11
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	12 // CharSet combines start-end rune ranges and unicode categories representing a set of characters
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	13 type CharSet struct {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	14 ranges []singleRange
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	15 categories []category
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	16 sub *CharSet //optional subtractor
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	17 negate bool
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	18 anything bool
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	19 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	20
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	21 type category struct {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	22 negate bool
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	23 cat string
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	24 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	25
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	26 type singleRange struct {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	27 first rune
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	28 last rune
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	29 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	30
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	31 const (
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	32 spaceCategoryText = " "
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	33 wordCategoryText = "W"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	34 )
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	35
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	36 var (
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	37 ecmaSpace = []rune{0x0009, 0x000e, 0x0020, 0x0021, 0x00a0, 0x00a1, 0x1680, 0x1681, 0x2000, 0x200b, 0x2028, 0x202a, 0x202f, 0x2030, 0x205f, 0x2060, 0x3000, 0x3001, 0xfeff, 0xff00}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	38 ecmaWord = []rune{0x0030, 0x003a, 0x0041, 0x005b, 0x005f, 0x0060, 0x0061, 0x007b}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	39 ecmaDigit = []rune{0x0030, 0x003a}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	40 )
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	41
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	42 var (
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	43 AnyClass = getCharSetFromOldString([]rune{0}, false)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	44 ECMAAnyClass = getCharSetFromOldString([]rune{0, 0x000a, 0x000b, 0x000d, 0x000e}, false)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	45 NoneClass = getCharSetFromOldString(nil, false)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	46 ECMAWordClass = getCharSetFromOldString(ecmaWord, false)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	47 NotECMAWordClass = getCharSetFromOldString(ecmaWord, true)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	48 ECMASpaceClass = getCharSetFromOldString(ecmaSpace, false)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	49 NotECMASpaceClass = getCharSetFromOldString(ecmaSpace, true)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	50 ECMADigitClass = getCharSetFromOldString(ecmaDigit, false)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	51 NotECMADigitClass = getCharSetFromOldString(ecmaDigit, true)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	52
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	53 WordClass = getCharSetFromCategoryString(false, false, wordCategoryText)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	54 NotWordClass = getCharSetFromCategoryString(true, false, wordCategoryText)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	55 SpaceClass = getCharSetFromCategoryString(false, false, spaceCategoryText)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	56 NotSpaceClass = getCharSetFromCategoryString(true, false, spaceCategoryText)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	57 DigitClass = getCharSetFromCategoryString(false, false, "Nd")
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	58 NotDigitClass = getCharSetFromCategoryString(false, true, "Nd")
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	59 )
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	60
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	61 var unicodeCategories = func() map[string]*unicode.RangeTable {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	62 retVal := make(map[string]*unicode.RangeTable)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	63 for k, v := range unicode.Scripts {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	64 retVal[k] = v
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	65 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	66 for k, v := range unicode.Categories {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	67 retVal[k] = v
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	68 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	69 for k, v := range unicode.Properties {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	70 retVal[k] = v
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	71 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	72 return retVal
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	73 }()
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	74
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	75 func getCharSetFromCategoryString(negateSet bool, negateCat bool, cats ...string) func() *CharSet {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	76 if negateCat && negateSet {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	77 panic("BUG! You should only negate the set OR the category in a constant setup, but not both")
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	78 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	79
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	80 c := CharSet{negate: negateSet}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	81
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	82 c.categories = make([]category, len(cats))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	83 for i, cat := range cats {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	84 c.categories[i] = category{cat: cat, negate: negateCat}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	85 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	86 return func() *CharSet {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	87 //make a copy each time
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	88 local := c
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	89 //return that address
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	90 return &local
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	91 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	92 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	93
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	94 func getCharSetFromOldString(setText []rune, negate bool) func() *CharSet {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	95 c := CharSet{}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	96 if len(setText) > 0 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	97 fillFirst := false
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	98 l := len(setText)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	99 if negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	100 if setText[0] == 0 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	101 setText = setText[1:]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	102 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	103 l++
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	104 fillFirst = true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	105 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	106 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	107
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	108 if l%2 == 0 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	109 c.ranges = make([]singleRange, l/2)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	110 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	111 c.ranges = make([]singleRange, l/2+1)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	112 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	113
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	114 first := true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	115 if fillFirst {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	116 c.ranges[0] = singleRange{first: 0}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	117 first = false
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	118 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	119
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	120 i := 0
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	121 for _, r := range setText {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	122 if first {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	123 // lower bound in a new range
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	124 c.ranges[i] = singleRange{first: r}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	125 first = false
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	126 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	127 c.ranges[i].last = r - 1
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	128 i++
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	129 first = true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	130 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	131 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	132 if !first {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	133 c.ranges[i].last = utf8.MaxRune
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	134 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	135 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	136
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	137 return func() *CharSet {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	138 local := c
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	139 return &local
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	140 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	141 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	142
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	143 // Copy makes a deep copy to prevent accidental mutation of a set
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	144 func (c CharSet) Copy() CharSet {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	145 ret := CharSet{
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	146 anything: c.anything,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	147 negate: c.negate,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	148 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	149
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	150 ret.ranges = append(ret.ranges, c.ranges...)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	151 ret.categories = append(ret.categories, c.categories...)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	152
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	153 if c.sub != nil {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	154 sub := c.sub.Copy()
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	155 ret.sub = &sub
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	156 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	157
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	158 return ret
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	159 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	160
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	161 // gets a human-readable description for a set string
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	162 func (c CharSet) String() string {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	163 buf := &bytes.Buffer{}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	164 buf.WriteRune('[')
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	165
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	166 if c.IsNegated() {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	167 buf.WriteRune('^')
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	168 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	169
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	170 for _, r := range c.ranges {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	171
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	172 buf.WriteString(CharDescription(r.first))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	173 if r.first != r.last {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	174 if r.last-r.first != 1 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	175 //groups that are 1 char apart skip the dash
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	176 buf.WriteRune('-')
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	177 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	178 buf.WriteString(CharDescription(r.last))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	179 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	180 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	181
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	182 for _, c := range c.categories {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	183 buf.WriteString(c.String())
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	184 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	185
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	186 if c.sub != nil {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	187 buf.WriteRune('-')
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	188 buf.WriteString(c.sub.String())
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	189 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	190
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	191 buf.WriteRune(']')
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	192
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	193 return buf.String()
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	194 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	195
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	196 // mapHashFill converts a charset into a buffer for use in maps
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	197 func (c CharSet) mapHashFill(buf *bytes.Buffer) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	198 if c.negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	199 buf.WriteByte(0)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	200 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	201 buf.WriteByte(1)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	202 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	203
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	204 binary.Write(buf, binary.LittleEndian, len(c.ranges))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	205 binary.Write(buf, binary.LittleEndian, len(c.categories))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	206 for _, r := range c.ranges {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	207 buf.WriteRune(r.first)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	208 buf.WriteRune(r.last)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	209 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	210 for _, ct := range c.categories {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	211 buf.WriteString(ct.cat)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	212 if ct.negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	213 buf.WriteByte(1)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	214 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	215 buf.WriteByte(0)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	216 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	217 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	218
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	219 if c.sub != nil {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	220 c.sub.mapHashFill(buf)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	221 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	222 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	223
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	224 // CharIn returns true if the rune is in our character set (either ranges or categories).
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	225 // It handles negations and subtracted sub-charsets.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	226 func (c CharSet) CharIn(ch rune) bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	227 val := false
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	228 // in s && !s.subtracted
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	229
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	230 //check ranges
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	231 for _, r := range c.ranges {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	232 if ch < r.first {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	233 continue
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	234 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	235 if ch <= r.last {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	236 val = true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	237 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	238 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	239 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	240
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	241 //check categories if we haven't already found a range
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	242 if !val && len(c.categories) > 0 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	243 for _, ct := range c.categories {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	244 // special categories...then unicode
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	245 if ct.cat == spaceCategoryText {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	246 if unicode.IsSpace(ch) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	247 // we found a space so we're done
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	248 // negate means this is a "bad" thing
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	249 val = !ct.negate
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	250 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	251 } else if ct.negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	252 val = true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	253 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	254 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	255 } else if ct.cat == wordCategoryText {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	256 if IsWordChar(ch) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	257 val = !ct.negate
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	258 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	259 } else if ct.negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	260 val = true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	261 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	262 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	263 } else if unicode.Is(unicodeCategories[ct.cat], ch) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	264 // if we're in this unicode category then we're done
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	265 // if negate=true on this category then we "failed" our test
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	266 // otherwise we're good that we found it
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	267 val = !ct.negate
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	268 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	269 } else if ct.negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	270 val = true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	271 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	272 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	273 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	274 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	275
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	276 // negate the whole char set
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	277 if c.negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	278 val = !val
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	279 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	280
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	281 // get subtracted recurse
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	282 if val && c.sub != nil {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	283 val = !c.sub.CharIn(ch)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	284 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	285
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	286 //log.Printf("Char '%v' in %v == %v", string(ch), c.String(), val)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	287 return val
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	288 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	289
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	290 func (c category) String() string {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	291 switch c.cat {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	292 case spaceCategoryText:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	293 if c.negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	294 return "\\S"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	295 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	296 return "\\s"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	297 case wordCategoryText:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	298 if c.negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	299 return "\\W"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	300 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	301 return "\\w"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	302 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	303 if _, ok := unicodeCategories[c.cat]; ok {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	304
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	305 if c.negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	306 return "\\P{" + c.cat + "}"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	307 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	308 return "\\p{" + c.cat + "}"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	309 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	310 return "Unknown category: " + c.cat
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	311 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	312
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	313 // CharDescription Produces a human-readable description for a single character.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	314 func CharDescription(ch rune) string {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	315 /*if ch == '\\' {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	316 return "\\\\"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	317 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	318
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	319 if ch > ' ' && ch <= '~' {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	320 return string(ch)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	321 } else if ch == '\n' {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	322 return "\\n"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	323 } else if ch == ' ' {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	324 return "\\ "
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	325 }*/
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	326
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	327 b := &bytes.Buffer{}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	328 escape(b, ch, false) //fmt.Sprintf("%U", ch)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	329 return b.String()
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	330 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	331
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	332 // According to UTS#18 Unicode Regular Expressions (http://www.unicode.org/reports/tr18/)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	333 // RL 1.4 Simple Word Boundaries The class of <word_character> includes all Alphabetic
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	334 // values from the Unicode character database, from UnicodeData.txt [UData], plus the U+200C
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	335 // ZERO WIDTH NON-JOINER and U+200D ZERO WIDTH JOINER.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	336 func IsWordChar(r rune) bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	337 //"L", "Mn", "Nd", "Pc"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	338 return unicode.In(r,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	339 unicode.Categories["L"], unicode.Categories["Mn"],
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	340 unicode.Categories["Nd"], unicode.Categories["Pc"]) \|\| r == '\u200D' \|\| r == '\u200C'
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	341 //return 'A' <= r && r <= 'Z' \|\| 'a' <= r && r <= 'z' \|\| '0' <= r && r <= '9' \|\| r == '_'
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	342 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	343
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	344 func IsECMAWordChar(r rune) bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	345 return unicode.In(r,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	346 unicode.Categories["L"], unicode.Categories["Mn"],
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	347 unicode.Categories["Nd"], unicode.Categories["Pc"])
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	348
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	349 //return 'A' <= r && r <= 'Z' \|\| 'a' <= r && r <= 'z' \|\| '0' <= r && r <= '9' \|\| r == '_'
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	350 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	351
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	352 // SingletonChar will return the char from the first range without validation.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	353 // It assumes you have checked for IsSingleton or IsSingletonInverse and will panic given bad input
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	354 func (c CharSet) SingletonChar() rune {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	355 return c.ranges[0].first
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	356 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	357
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	358 func (c CharSet) IsSingleton() bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	359 return !c.negate && //negated is multiple chars
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	360 len(c.categories) == 0 && len(c.ranges) == 1 && // multiple ranges and unicode classes represent multiple chars
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	361 c.sub == nil && // subtraction means we've got multiple chars
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	362 c.ranges[0].first == c.ranges[0].last // first and last equal means we're just 1 char
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	363 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	364
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	365 func (c CharSet) IsSingletonInverse() bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	366 return c.negate && //same as above, but requires negated
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	367 len(c.categories) == 0 && len(c.ranges) == 1 && // multiple ranges and unicode classes represent multiple chars
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	368 c.sub == nil && // subtraction means we've got multiple chars
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	369 c.ranges[0].first == c.ranges[0].last // first and last equal means we're just 1 char
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	370 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	371
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	372 func (c CharSet) IsMergeable() bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	373 return !c.IsNegated() && !c.HasSubtraction()
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	374 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	375
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	376 func (c CharSet) IsNegated() bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	377 return c.negate
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	378 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	379
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	380 func (c CharSet) HasSubtraction() bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	381 return c.sub != nil
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	382 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	383
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	384 func (c CharSet) IsEmpty() bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	385 return len(c.ranges) == 0 && len(c.categories) == 0 && c.sub == nil
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	386 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	387
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	388 func (c *CharSet) addDigit(ecma, negate bool, pattern string) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	389 if ecma {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	390 if negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	391 c.addRanges(NotECMADigitClass().ranges)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	392 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	393 c.addRanges(ECMADigitClass().ranges)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	394 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	395 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	396 c.addCategories(category{cat: "Nd", negate: negate})
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	397 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	398 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	399
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	400 func (c *CharSet) addChar(ch rune) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	401 c.addRange(ch, ch)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	402 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	403
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	404 func (c *CharSet) addSpace(ecma, negate bool) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	405 if ecma {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	406 if negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	407 c.addRanges(NotECMASpaceClass().ranges)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	408 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	409 c.addRanges(ECMASpaceClass().ranges)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	410 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	411 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	412 c.addCategories(category{cat: spaceCategoryText, negate: negate})
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	413 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	414 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	415
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	416 func (c *CharSet) addWord(ecma, negate bool) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	417 if ecma {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	418 if negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	419 c.addRanges(NotECMAWordClass().ranges)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	420 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	421 c.addRanges(ECMAWordClass().ranges)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	422 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	423 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	424 c.addCategories(category{cat: wordCategoryText, negate: negate})
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	425 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	426 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	427
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	428 // Add set ranges and categories into ours -- no deduping or anything
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	429 func (c *CharSet) addSet(set CharSet) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	430 if c.anything {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	431 return
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	432 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	433 if set.anything {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	434 c.makeAnything()
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	435 return
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	436 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	437 // just append here to prevent double-canon
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	438 c.ranges = append(c.ranges, set.ranges...)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	439 c.addCategories(set.categories...)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	440 c.canonicalize()
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	441 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	442
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	443 func (c *CharSet) makeAnything() {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	444 c.anything = true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	445 c.categories = []category{}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	446 c.ranges = AnyClass().ranges
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	447 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	448
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	449 func (c *CharSet) addCategories(cats ...category) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	450 // don't add dupes and remove positive+negative
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	451 if c.anything {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	452 // if we've had a previous positive+negative group then
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	453 // just return, we're as broad as we can get
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	454 return
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	455 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	456
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	457 for _, ct := range cats {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	458 found := false
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	459 for _, ct2 := range c.categories {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	460 if ct.cat == ct2.cat {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	461 if ct.negate != ct2.negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	462 // oposite negations...this mean we just
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	463 // take us as anything and move on
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	464 c.makeAnything()
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	465 return
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	466 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	467 found = true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	468 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	469 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	470 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	471
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	472 if !found {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	473 c.categories = append(c.categories, ct)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	474 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	475 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	476 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	477
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	478 // Merges new ranges to our own
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	479 func (c *CharSet) addRanges(ranges []singleRange) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	480 if c.anything {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	481 return
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	482 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	483 c.ranges = append(c.ranges, ranges...)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	484 c.canonicalize()
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	485 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	486
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	487 // Merges everything but the new ranges into our own
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	488 func (c *CharSet) addNegativeRanges(ranges []singleRange) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	489 if c.anything {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	490 return
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	491 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	492
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	493 var hi rune
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	494
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	495 // convert incoming ranges into opposites, assume they are in order
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	496 for _, r := range ranges {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	497 if hi < r.first {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	498 c.ranges = append(c.ranges, singleRange{hi, r.first - 1})
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	499 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	500 hi = r.last + 1
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	501 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	502
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	503 if hi < utf8.MaxRune {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	504 c.ranges = append(c.ranges, singleRange{hi, utf8.MaxRune})
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	505 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	506
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	507 c.canonicalize()
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	508 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	509
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	510 func isValidUnicodeCat(catName string) bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	511 _, ok := unicodeCategories[catName]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	512 return ok
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	513 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	514
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	515 func (c *CharSet) addCategory(categoryName string, negate, caseInsensitive bool, pattern string) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	516 if !isValidUnicodeCat(categoryName) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	517 // unknown unicode category, script, or property "blah"
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	518 panic(fmt.Errorf("Unknown unicode category, script, or property '%v'", categoryName))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	519
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	520 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	521
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	522 if caseInsensitive && (categoryName == "Ll" \|\| categoryName == "Lu" \|\| categoryName == "Lt") {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	523 // when RegexOptions.IgnoreCase is specified then {Ll} {Lu} and {Lt} cases should all match
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	524 c.addCategories(
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	525 category{cat: "Ll", negate: negate},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	526 category{cat: "Lu", negate: negate},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	527 category{cat: "Lt", negate: negate})
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	528 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	529 c.addCategories(category{cat: categoryName, negate: negate})
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	530 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	531
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	532 func (c CharSet) addSubtraction(sub CharSet) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	533 c.sub = sub
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	534 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	535
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	536 func (c *CharSet) addRange(chMin, chMax rune) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	537 c.ranges = append(c.ranges, singleRange{first: chMin, last: chMax})
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	538 c.canonicalize()
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	539 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	540
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	541 func (c *CharSet) addNamedASCII(name string, negate bool) bool {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	542 var rs []singleRange
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	543
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	544 switch name {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	545 case "alnum":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	546 rs = []singleRange{singleRange{'0', '9'}, singleRange{'A', 'Z'}, singleRange{'a', 'z'}}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	547 case "alpha":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	548 rs = []singleRange{singleRange{'A', 'Z'}, singleRange{'a', 'z'}}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	549 case "ascii":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	550 rs = []singleRange{singleRange{0, 0x7f}}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	551 case "blank":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	552 rs = []singleRange{singleRange{'\t', '\t'}, singleRange{' ', ' '}}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	553 case "cntrl":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	554 rs = []singleRange{singleRange{0, 0x1f}, singleRange{0x7f, 0x7f}}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	555 case "digit":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	556 c.addDigit(false, negate, "")
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	557 case "graph":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	558 rs = []singleRange{singleRange{'!', '~'}}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	559 case "lower":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	560 rs = []singleRange{singleRange{'a', 'z'}}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	561 case "print":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	562 rs = []singleRange{singleRange{' ', '~'}}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	563 case "punct": //[!-/:-@[-`{-~]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	564 rs = []singleRange{singleRange{'!', '/'}, singleRange{':', '@'}, singleRange{'[', '`'}, singleRange{'{', '~'}}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	565 case "space":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	566 c.addSpace(true, negate)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	567 case "upper":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	568 rs = []singleRange{singleRange{'A', 'Z'}}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	569 case "word":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	570 c.addWord(true, negate)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	571 case "xdigit":
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	572 rs = []singleRange{singleRange{'0', '9'}, singleRange{'A', 'F'}, singleRange{'a', 'f'}}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	573 default:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	574 return false
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	575 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	576
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	577 if len(rs) > 0 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	578 if negate {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	579 c.addNegativeRanges(rs)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	580 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	581 c.addRanges(rs)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	582 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	583 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	584
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	585 return true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	586 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	587
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	588 type singleRangeSorter []singleRange
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	589
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	590 func (p singleRangeSorter) Len() int { return len(p) }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	591 func (p singleRangeSorter) Less(i, j int) bool { return p[i].first < p[j].first }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	592 func (p singleRangeSorter) Swap(i, j int) { p[i], p[j] = p[j], p[i] }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	593
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	594 // Logic to reduce a character class to a unique, sorted form.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	595 func (c *CharSet) canonicalize() {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	596 var i, j int
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	597 var last rune
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	598
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	599 //
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	600 // Find and eliminate overlapping or abutting ranges
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	601 //
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	602
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	603 if len(c.ranges) > 1 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	604 sort.Sort(singleRangeSorter(c.ranges))
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	605
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	606 done := false
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	607
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	608 for i, j = 1, 0; ; i++ {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	609 for last = c.ranges[j].last; ; i++ {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	610 if i == len(c.ranges) \|\| last == utf8.MaxRune {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	611 done = true
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	612 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	613 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	614
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	615 CurrentRange := c.ranges[i]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	616 if CurrentRange.first > last+1 {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	617 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	618 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	619
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	620 if last < CurrentRange.last {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	621 last = CurrentRange.last
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	622 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	623 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	624
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	625 c.ranges[j] = singleRange{first: c.ranges[j].first, last: last}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	626
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	627 j++
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	628
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	629 if done {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	630 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	631 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	632
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	633 if j < i {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	634 c.ranges[j] = c.ranges[i]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	635 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	636 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	637
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	638 c.ranges = append(c.ranges[:j], c.ranges[len(c.ranges):]...)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	639 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	640 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	641
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	642 // Adds to the class any lowercase versions of characters already
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	643 // in the class. Used for case-insensitivity.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	644 func (c *CharSet) addLowercase() {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	645 if c.anything {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	646 return
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	647 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	648 toAdd := []singleRange{}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	649 for i := 0; i < len(c.ranges); i++ {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	650 r := c.ranges[i]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	651 if r.first == r.last {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	652 lower := unicode.ToLower(r.first)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	653 c.ranges[i] = singleRange{first: lower, last: lower}
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	654 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	655 toAdd = append(toAdd, r)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	656 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	657 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	658
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	659 for _, r := range toAdd {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	660 c.addLowercaseRange(r.first, r.last)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	661 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	662 c.canonicalize()
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	663 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	664
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	665 /**************************************************************************
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	666 Let U be the set of Unicode character values and let L be the lowercase
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	667 function, mapping from U to U. To perform case insensitive matching of
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	668 character sets, we need to be able to map an interval I in U, say
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	669
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	670 I = [chMin, chMax] = { ch : chMin <= ch <= chMax }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	671
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	672 to a set A such that A contains L(I) and A is contained in the union of
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	673 I and L(I).
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	674
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	675 The table below partitions U into intervals on which L is non-decreasing.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	676 Thus, for any interval J = [a, b] contained in one of these intervals,
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	677 L(J) is contained in [L(a), L(b)].
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	678
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	679 It is also true that for any such J, [L(a), L(b)] is contained in the
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	680 union of J and L(J). This does not follow from L being non-decreasing on
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	681 these intervals. It follows from the nature of the L on each interval.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	682 On each interval, L has one of the following forms:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	683
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	684 (1) L(ch) = constant (LowercaseSet)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	685 (2) L(ch) = ch + offset (LowercaseAdd)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	686 (3) L(ch) = ch \| 1 (LowercaseBor)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	687 (4) L(ch) = ch + (ch & 1) (LowercaseBad)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	688
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	689 It is easy to verify that for any of these forms [L(a), L(b)] is
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	690 contained in the union of [a, b] and L([a, b]).
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	691 ***************************************************************************/
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	692
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	693 const (
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	694 LowercaseSet = 0 // Set to arg.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	695 LowercaseAdd = 1 // Add arg.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	696 LowercaseBor = 2 // Bitwise or with 1.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	697 LowercaseBad = 3 // Bitwise and with 1 and add original.
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	698 )
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	699
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	700 type lcMap struct {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	701 chMin, chMax rune
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	702 op, data int32
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	703 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	704
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	705 var lcTable = []lcMap{
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	706 lcMap{'\u0041', '\u005A', LowercaseAdd, 32},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	707 lcMap{'\u00C0', '\u00DE', LowercaseAdd, 32},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	708 lcMap{'\u0100', '\u012E', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	709 lcMap{'\u0130', '\u0130', LowercaseSet, 0x0069},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	710 lcMap{'\u0132', '\u0136', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	711 lcMap{'\u0139', '\u0147', LowercaseBad, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	712 lcMap{'\u014A', '\u0176', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	713 lcMap{'\u0178', '\u0178', LowercaseSet, 0x00FF},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	714 lcMap{'\u0179', '\u017D', LowercaseBad, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	715 lcMap{'\u0181', '\u0181', LowercaseSet, 0x0253},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	716 lcMap{'\u0182', '\u0184', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	717 lcMap{'\u0186', '\u0186', LowercaseSet, 0x0254},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	718 lcMap{'\u0187', '\u0187', LowercaseSet, 0x0188},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	719 lcMap{'\u0189', '\u018A', LowercaseAdd, 205},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	720 lcMap{'\u018B', '\u018B', LowercaseSet, 0x018C},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	721 lcMap{'\u018E', '\u018E', LowercaseSet, 0x01DD},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	722 lcMap{'\u018F', '\u018F', LowercaseSet, 0x0259},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	723 lcMap{'\u0190', '\u0190', LowercaseSet, 0x025B},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	724 lcMap{'\u0191', '\u0191', LowercaseSet, 0x0192},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	725 lcMap{'\u0193', '\u0193', LowercaseSet, 0x0260},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	726 lcMap{'\u0194', '\u0194', LowercaseSet, 0x0263},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	727 lcMap{'\u0196', '\u0196', LowercaseSet, 0x0269},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	728 lcMap{'\u0197', '\u0197', LowercaseSet, 0x0268},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	729 lcMap{'\u0198', '\u0198', LowercaseSet, 0x0199},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	730 lcMap{'\u019C', '\u019C', LowercaseSet, 0x026F},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	731 lcMap{'\u019D', '\u019D', LowercaseSet, 0x0272},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	732 lcMap{'\u019F', '\u019F', LowercaseSet, 0x0275},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	733 lcMap{'\u01A0', '\u01A4', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	734 lcMap{'\u01A7', '\u01A7', LowercaseSet, 0x01A8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	735 lcMap{'\u01A9', '\u01A9', LowercaseSet, 0x0283},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	736 lcMap{'\u01AC', '\u01AC', LowercaseSet, 0x01AD},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	737 lcMap{'\u01AE', '\u01AE', LowercaseSet, 0x0288},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	738 lcMap{'\u01AF', '\u01AF', LowercaseSet, 0x01B0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	739 lcMap{'\u01B1', '\u01B2', LowercaseAdd, 217},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	740 lcMap{'\u01B3', '\u01B5', LowercaseBad, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	741 lcMap{'\u01B7', '\u01B7', LowercaseSet, 0x0292},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	742 lcMap{'\u01B8', '\u01B8', LowercaseSet, 0x01B9},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	743 lcMap{'\u01BC', '\u01BC', LowercaseSet, 0x01BD},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	744 lcMap{'\u01C4', '\u01C5', LowercaseSet, 0x01C6},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	745 lcMap{'\u01C7', '\u01C8', LowercaseSet, 0x01C9},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	746 lcMap{'\u01CA', '\u01CB', LowercaseSet, 0x01CC},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	747 lcMap{'\u01CD', '\u01DB', LowercaseBad, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	748 lcMap{'\u01DE', '\u01EE', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	749 lcMap{'\u01F1', '\u01F2', LowercaseSet, 0x01F3},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	750 lcMap{'\u01F4', '\u01F4', LowercaseSet, 0x01F5},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	751 lcMap{'\u01FA', '\u0216', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	752 lcMap{'\u0386', '\u0386', LowercaseSet, 0x03AC},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	753 lcMap{'\u0388', '\u038A', LowercaseAdd, 37},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	754 lcMap{'\u038C', '\u038C', LowercaseSet, 0x03CC},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	755 lcMap{'\u038E', '\u038F', LowercaseAdd, 63},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	756 lcMap{'\u0391', '\u03AB', LowercaseAdd, 32},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	757 lcMap{'\u03E2', '\u03EE', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	758 lcMap{'\u0401', '\u040F', LowercaseAdd, 80},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	759 lcMap{'\u0410', '\u042F', LowercaseAdd, 32},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	760 lcMap{'\u0460', '\u0480', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	761 lcMap{'\u0490', '\u04BE', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	762 lcMap{'\u04C1', '\u04C3', LowercaseBad, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	763 lcMap{'\u04C7', '\u04C7', LowercaseSet, 0x04C8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	764 lcMap{'\u04CB', '\u04CB', LowercaseSet, 0x04CC},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	765 lcMap{'\u04D0', '\u04EA', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	766 lcMap{'\u04EE', '\u04F4', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	767 lcMap{'\u04F8', '\u04F8', LowercaseSet, 0x04F9},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	768 lcMap{'\u0531', '\u0556', LowercaseAdd, 48},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	769 lcMap{'\u10A0', '\u10C5', LowercaseAdd, 48},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	770 lcMap{'\u1E00', '\u1EF8', LowercaseBor, 0},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	771 lcMap{'\u1F08', '\u1F0F', LowercaseAdd, -8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	772 lcMap{'\u1F18', '\u1F1F', LowercaseAdd, -8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	773 lcMap{'\u1F28', '\u1F2F', LowercaseAdd, -8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	774 lcMap{'\u1F38', '\u1F3F', LowercaseAdd, -8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	775 lcMap{'\u1F48', '\u1F4D', LowercaseAdd, -8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	776 lcMap{'\u1F59', '\u1F59', LowercaseSet, 0x1F51},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	777 lcMap{'\u1F5B', '\u1F5B', LowercaseSet, 0x1F53},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	778 lcMap{'\u1F5D', '\u1F5D', LowercaseSet, 0x1F55},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	779 lcMap{'\u1F5F', '\u1F5F', LowercaseSet, 0x1F57},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	780 lcMap{'\u1F68', '\u1F6F', LowercaseAdd, -8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	781 lcMap{'\u1F88', '\u1F8F', LowercaseAdd, -8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	782 lcMap{'\u1F98', '\u1F9F', LowercaseAdd, -8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	783 lcMap{'\u1FA8', '\u1FAF', LowercaseAdd, -8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	784 lcMap{'\u1FB8', '\u1FB9', LowercaseAdd, -8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	785 lcMap{'\u1FBA', '\u1FBB', LowercaseAdd, -74},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	786 lcMap{'\u1FBC', '\u1FBC', LowercaseSet, 0x1FB3},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	787 lcMap{'\u1FC8', '\u1FCB', LowercaseAdd, -86},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	788 lcMap{'\u1FCC', '\u1FCC', LowercaseSet, 0x1FC3},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	789 lcMap{'\u1FD8', '\u1FD9', LowercaseAdd, -8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	790 lcMap{'\u1FDA', '\u1FDB', LowercaseAdd, -100},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	791 lcMap{'\u1FE8', '\u1FE9', LowercaseAdd, -8},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	792 lcMap{'\u1FEA', '\u1FEB', LowercaseAdd, -112},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	793 lcMap{'\u1FEC', '\u1FEC', LowercaseSet, 0x1FE5},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	794 lcMap{'\u1FF8', '\u1FF9', LowercaseAdd, -128},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	795 lcMap{'\u1FFA', '\u1FFB', LowercaseAdd, -126},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	796 lcMap{'\u1FFC', '\u1FFC', LowercaseSet, 0x1FF3},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	797 lcMap{'\u2160', '\u216F', LowercaseAdd, 16},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	798 lcMap{'\u24B6', '\u24D0', LowercaseAdd, 26},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	799 lcMap{'\uFF21', '\uFF3A', LowercaseAdd, 32},
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	800 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	801
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	802 func (c *CharSet) addLowercaseRange(chMin, chMax rune) {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	803 var i, iMax, iMid int
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	804 var chMinT, chMaxT rune
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	805 var lc lcMap
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	806
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	807 for i, iMax = 0, len(lcTable); i < iMax; {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	808 iMid = (i + iMax) / 2
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	809 if lcTable[iMid].chMax < chMin {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	810 i = iMid + 1
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	811 } else {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	812 iMax = iMid
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	813 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	814 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	815
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	816 for ; i < len(lcTable); i++ {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	817 lc = lcTable[i]
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	818 if lc.chMin > chMax {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	819 return
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	820 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	821 chMinT = lc.chMin
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	822 if chMinT < chMin {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	823 chMinT = chMin
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	824 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	825
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	826 chMaxT = lc.chMax
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	827 if chMaxT > chMax {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	828 chMaxT = chMax
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	829 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	830
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	831 switch lc.op {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	832 case LowercaseSet:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	833 chMinT = rune(lc.data)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	834 chMaxT = rune(lc.data)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	835 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	836 case LowercaseAdd:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	837 chMinT += lc.data
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	838 chMaxT += lc.data
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	839 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	840 case LowercaseBor:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	841 chMinT \|= 1
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	842 chMaxT \|= 1
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	843 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	844 case LowercaseBad:
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	845 chMinT += (chMinT & 1)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	846 chMaxT += (chMaxT & 1)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	847 break
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	848 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	849
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	850 if chMinT < chMin \|\| chMaxT > chMax {
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	851 c.addRange(chMinT, chMaxT)
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	852 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	853 }
787b5ee0289d Use vendored modules yakumo.izuru parents: diff changeset	854 }

Mercurial > yakumo_izuru > aya

annotate vendor/github.com/dlclark/regexp2/syntax/charclass.go @ 66:787b5ee0289d draft