Fossil

Hex Artifact Content
Login

Artifact 21359f8b49b95337e4959f098a382e06409e10bc62a3b1387afd230157f0c55c:


0000: 2f 2a 0a 2a 2a 20 43 6f 70 79 72 69 67 68 74 20  /*.** Copyright 
0010: 28 63 29 20 32 30 31 33 20 44 2e 20 52 69 63 68  (c) 2013 D. Rich
0020: 61 72 64 20 48 69 70 70 0a 2a 2a 0a 2a 2a 20 54  ard Hipp.**.** T
0030: 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73 20 66  his program is f
0040: 72 65 65 20 73 6f 66 74 77 61 72 65 3b 20 79 6f  ree software; yo
0050: 75 20 63 61 6e 20 72 65 64 69 73 74 72 69 62 75  u can redistribu
0060: 74 65 20 69 74 20 61 6e 64 2f 6f 72 0a 2a 2a 20  te it and/or.** 
0070: 6d 6f 64 69 66 79 20 69 74 20 75 6e 64 65 72 20  modify it under 
0080: 74 68 65 20 74 65 72 6d 73 20 6f 66 20 74 68 65  the terms of the
0090: 20 53 69 6d 70 6c 69 66 69 65 64 20 42 53 44 20   Simplified BSD 
00a0: 4c 69 63 65 6e 73 65 20 28 61 6c 73 6f 0a 2a 2a  License (also.**
00b0: 20 6b 6e 6f 77 6e 20 61 73 20 74 68 65 20 22 32   known as the "2
00c0: 2d 43 6c 61 75 73 65 20 4c 69 63 65 6e 73 65 22  -Clause License"
00d0: 20 6f 72 20 22 46 72 65 65 42 53 44 20 4c 69 63   or "FreeBSD Lic
00e0: 65 6e 73 65 22 2e 29 0a 2a 2a 0a 2a 2a 20 54 68  ense".).**.** Th
00f0: 69 73 20 70 72 6f 67 72 61 6d 20 69 73 20 64 69  is program is di
0100: 73 74 72 69 62 75 74 65 64 20 69 6e 20 74 68 65  stributed in the
0110: 20 68 6f 70 65 20 74 68 61 74 20 69 74 20 77 69   hope that it wi
0120: 6c 6c 20 62 65 20 75 73 65 66 75 6c 2c 0a 2a 2a  ll be useful,.**
0130: 20 62 75 74 20 77 69 74 68 6f 75 74 20 61 6e 79   but without any
0140: 20 77 61 72 72 61 6e 74 79 3b 20 77 69 74 68 6f   warranty; witho
0150: 75 74 20 65 76 65 6e 20 74 68 65 20 69 6d 70 6c  ut even the impl
0160: 69 65 64 20 77 61 72 72 61 6e 74 79 20 6f 66 0a  ied warranty of.
0170: 2a 2a 20 6d 65 72 63 68 61 6e 74 61 62 69 6c 69  ** merchantabili
0180: 74 79 20 6f 72 20 66 69 74 6e 65 73 73 20 66 6f  ty or fitness fo
0190: 72 20 61 20 70 61 72 74 69 63 75 6c 61 72 20 70  r a particular p
01a0: 75 72 70 6f 73 65 2e 0a 2a 2a 0a 2a 2a 20 41 75  urpose..**.** Au
01b0: 74 68 6f 72 20 63 6f 6e 74 61 63 74 20 69 6e 66  thor contact inf
01c0: 6f 72 6d 61 74 69 6f 6e 3a 0a 2a 2a 20 20 20 64  ormation:.**   d
01d0: 72 68 40 68 77 61 63 69 2e 63 6f 6d 0a 2a 2a 20  rh@hwaci.com.** 
01e0: 20 20 68 74 74 70 3a 2f 2f 77 77 77 2e 68 77 61    http://www.hwa
01f0: 63 69 2e 63 6f 6d 2f 64 72 68 2f 0a 2a 2a 0a 2a  ci.com/drh/.**.*
0200: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0210: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0220: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0230: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0240: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 0a 2a  **************.*
0250: 2a 0a 2a 2a 20 54 68 69 73 20 66 69 6c 65 20 77  *.** This file w
0260: 61 73 20 61 64 61 70 74 65 64 20 66 72 6f 6d 20  as adapted from 
0270: 74 68 65 20 65 78 74 2f 6d 69 73 63 2f 72 65 67  the ext/misc/reg
0280: 65 78 70 2e 63 20 66 69 6c 65 20 69 6e 20 53 51  exp.c file in SQ
0290: 4c 69 74 65 33 2e 20 20 54 68 61 74 0a 2a 2a 20  Lite3.  That.** 
02a0: 66 69 6c 65 20 69 73 20 69 6e 20 74 68 65 20 70  file is in the p
02b0: 75 62 6c 69 63 20 64 6f 6d 61 69 6e 2e 0a 2a 2a  ublic domain..**
02c0: 0a 2a 2a 20 53 65 65 20 2e 2e 2f 77 77 77 2f 67  .** See ../www/g
02d0: 72 65 70 2e 6d 64 20 66 6f 72 20 64 65 74 61 69  rep.md for detai
02e0: 6c 73 20 6f 66 20 74 68 65 20 61 6c 67 6f 72 69  ls of the algori
02f0: 74 68 6d 20 61 6e 64 20 52 45 20 64 69 61 6c 65  thm and RE diale
0300: 63 74 2e 0a 2a 2f 0a 23 69 6e 63 6c 75 64 65 20  ct..*/.#include 
0310: 22 63 6f 6e 66 69 67 2e 68 22 0a 23 69 6e 63 6c  "config.h".#incl
0320: 75 64 65 20 22 72 65 67 65 78 70 2e 68 22 0a 0a  ude "regexp.h"..
0330: 2f 2a 20 54 68 65 20 65 6e 64 2d 6f 66 2d 69 6e  /* The end-of-in
0340: 70 75 74 20 63 68 61 72 61 63 74 65 72 20 2a 2f  put character */
0350: 0a 23 64 65 66 69 6e 65 20 52 45 5f 45 4f 46 20  .#define RE_EOF 
0360: 20 20 20 20 20 20 20 20 20 20 20 30 20 20 20 20             0    
0370: 2f 2a 20 45 6e 64 20 6f 66 20 69 6e 70 75 74 20  /* End of input 
0380: 2a 2f 0a 0a 2f 2a 20 54 68 65 20 4e 46 41 20 69  */../* The NFA i
0390: 73 20 69 6d 70 6c 65 6d 65 6e 74 65 64 20 61 73  s implemented as
03a0: 20 73 65 71 75 65 6e 63 65 20 6f 66 20 6f 70 63   sequence of opc
03b0: 6f 64 65 73 20 74 61 6b 65 6e 20 66 72 6f 6d 20  odes taken from 
03c0: 74 68 65 20 66 6f 6c 6c 6f 77 69 6e 67 0a 2a 2a  the following.**
03d0: 20 73 65 74 2e 20 20 45 61 63 68 20 6f 70 63 6f   set.  Each opco
03e0: 64 65 20 68 61 73 20 61 20 73 69 6e 67 6c 65 20  de has a single 
03f0: 69 6e 74 65 67 65 72 20 61 72 67 75 6d 65 6e 74  integer argument
0400: 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f  ..*/.#define RE_
0410: 4f 50 5f 4d 41 54 43 48 20 20 20 20 20 20 20 31  OP_MATCH       1
0420: 20 20 20 20 2f 2a 20 4d 61 74 63 68 20 74 68 65      /* Match the
0430: 20 6f 6e 65 20 63 68 61 72 61 63 74 65 72 20 69   one character i
0440: 6e 20 74 68 65 20 61 72 67 75 6d 65 6e 74 20 2a  n the argument *
0450: 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f  /.#define RE_OP_
0460: 41 4e 59 20 20 20 20 20 20 20 20 20 32 20 20 20  ANY         2   
0470: 20 2f 2a 20 4d 61 74 63 68 20 61 6e 79 20 6f 6e   /* Match any on
0480: 65 20 63 68 61 72 61 63 74 65 72 2e 20 20 28 49  e character.  (I
0490: 6d 70 6c 65 6d 65 6e 74 73 20 22 2e 22 29 20 2a  mplements ".") *
04a0: 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f  /.#define RE_OP_
04b0: 41 4e 59 53 54 41 52 20 20 20 20 20 33 20 20 20  ANYSTAR     3   
04c0: 20 2f 2a 20 53 70 65 63 69 61 6c 20 6f 70 74 69   /* Special opti
04d0: 6d 69 7a 65 64 20 76 65 72 73 69 6f 6e 20 6f 66  mized version of
04e0: 20 2e 2a 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52   .* */.#define R
04f0: 45 5f 4f 50 5f 46 4f 52 4b 20 20 20 20 20 20 20  E_OP_FORK       
0500: 20 34 20 20 20 20 2f 2a 20 43 6f 6e 74 69 6e 75   4    /* Continu
0510: 65 20 74 6f 20 62 6f 74 68 20 6e 65 78 74 20 61  e to both next a
0520: 6e 64 20 6f 70 63 6f 64 65 20 61 74 20 69 41 72  nd opcode at iAr
0530: 67 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f  g */.#define RE_
0540: 4f 50 5f 47 4f 54 4f 20 20 20 20 20 20 20 20 35  OP_GOTO        5
0550: 20 20 20 20 2f 2a 20 4a 75 6d 70 20 74 6f 20 6f      /* Jump to o
0560: 70 63 6f 64 65 20 61 74 20 69 41 72 67 20 2a 2f  pcode at iArg */
0570: 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 41  .#define RE_OP_A
0580: 43 43 45 50 54 20 20 20 20 20 20 36 20 20 20 20  CCEPT      6    
0590: 2f 2a 20 48 61 6c 74 20 61 6e 64 20 69 6e 64 69  /* Halt and indi
05a0: 63 61 74 65 20 61 20 73 75 63 63 65 73 73 66 75  cate a successfu
05b0: 6c 20 6d 61 74 63 68 20 2a 2f 0a 23 64 65 66 69  l match */.#defi
05c0: 6e 65 20 52 45 5f 4f 50 5f 43 43 5f 49 4e 43 20  ne RE_OP_CC_INC 
05d0: 20 20 20 20 20 37 20 20 20 20 2f 2a 20 42 65 67       7    /* Beg
05e0: 69 6e 6e 69 6e 67 20 6f 66 20 61 20 5b 2e 2e 2e  inning of a [...
05f0: 5d 20 63 68 61 72 61 63 74 65 72 20 63 6c 61 73  ] character clas
0600: 73 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f  s */.#define RE_
0610: 4f 50 5f 43 43 5f 45 58 43 20 20 20 20 20 20 38  OP_CC_EXC      8
0620: 20 20 20 20 2f 2a 20 42 65 67 69 6e 6e 69 6e 67      /* Beginning
0630: 20 6f 66 20 61 20 5b 5e 2e 2e 2e 5d 20 63 68 61   of a [^...] cha
0640: 72 61 63 74 65 72 20 63 6c 61 73 73 20 2a 2f 0a  racter class */.
0650: 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 43 43  #define RE_OP_CC
0660: 5f 56 41 4c 55 45 20 20 20 20 39 20 20 20 20 2f  _VALUE    9    /
0670: 2a 20 53 69 6e 67 6c 65 20 76 61 6c 75 65 20 69  * Single value i
0680: 6e 20 61 20 63 68 61 72 61 63 74 65 72 20 63 6c  n a character cl
0690: 61 73 73 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  ass */.#define R
06a0: 45 5f 4f 50 5f 43 43 5f 52 41 4e 47 45 20 20 20  E_OP_CC_RANGE   
06b0: 31 30 20 20 20 20 2f 2a 20 52 61 6e 67 65 20 6f  10    /* Range o
06c0: 66 20 76 61 6c 75 65 73 20 69 6e 20 61 20 63 68  f values in a ch
06d0: 61 72 61 63 74 65 72 20 63 6c 61 73 73 20 2a 2f  aracter class */
06e0: 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 57  .#define RE_OP_W
06f0: 4f 52 44 20 20 20 20 20 20 20 31 31 20 20 20 20  ORD       11    
0700: 2f 2a 20 50 65 72 6c 20 77 6f 72 64 20 63 68 61  /* Perl word cha
0710: 72 61 63 74 65 72 20 5b 41 2d 5a 61 2d 7a 30 2d  racter [A-Za-z0-
0720: 39 5f 5d 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  9_] */.#define R
0730: 45 5f 4f 50 5f 4e 4f 54 57 4f 52 44 20 20 20 20  E_OP_NOTWORD    
0740: 31 32 20 20 20 20 2f 2a 20 4e 6f 74 20 61 20 70  12    /* Not a p
0750: 65 72 6c 20 77 6f 72 64 20 63 68 61 72 61 63 74  erl word charact
0760: 65 72 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45  er */.#define RE
0770: 5f 4f 50 5f 44 49 47 49 54 20 20 20 20 20 20 31  _OP_DIGIT      1
0780: 33 20 20 20 20 2f 2a 20 64 69 67 69 74 3a 20 20  3    /* digit:  
0790: 5b 30 2d 39 5d 20 2a 2f 0a 23 64 65 66 69 6e 65  [0-9] */.#define
07a0: 20 52 45 5f 4f 50 5f 4e 4f 54 44 49 47 49 54 20   RE_OP_NOTDIGIT 
07b0: 20 20 31 34 20 20 20 20 2f 2a 20 4e 6f 74 20 61    14    /* Not a
07c0: 20 64 69 67 69 74 20 2a 2f 0a 23 64 65 66 69 6e   digit */.#defin
07d0: 65 20 52 45 5f 4f 50 5f 53 50 41 43 45 20 20 20  e RE_OP_SPACE   
07e0: 20 20 20 31 35 20 20 20 20 2f 2a 20 73 70 61 63     15    /* spac
07f0: 65 3a 20 20 5b 20 5c 74 5c 6e 5c 72 5c 76 5c 66  e:  [ \t\n\r\v\f
0800: 5d 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f  ] */.#define RE_
0810: 4f 50 5f 4e 4f 54 53 50 41 43 45 20 20 20 31 36  OP_NOTSPACE   16
0820: 20 20 20 20 2f 2a 20 4e 6f 74 20 61 20 64 69 67      /* Not a dig
0830: 69 74 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45  it */.#define RE
0840: 5f 4f 50 5f 42 4f 55 4e 44 41 52 59 20 20 20 31  _OP_BOUNDARY   1
0850: 37 20 20 20 20 2f 2a 20 42 6f 75 6e 64 61 72 79  7    /* Boundary
0860: 20 62 65 74 77 65 65 6e 20 77 6f 72 64 20 61 6e   between word an
0870: 64 20 6e 6f 6e 2d 77 6f 72 64 20 2a 2f 0a 0a 2f  d non-word */../
0880: 2a 20 45 61 63 68 20 6f 70 63 6f 64 65 20 69 73  * Each opcode is
0890: 20 61 20 22 73 74 61 74 65 22 20 69 6e 20 74 68   a "state" in th
08a0: 65 20 4e 46 41 20 2a 2f 0a 74 79 70 65 64 65 66  e NFA */.typedef
08b0: 20 75 6e 73 69 67 6e 65 64 20 73 68 6f 72 74 20   unsigned short 
08c0: 52 65 53 74 61 74 65 4e 75 6d 62 65 72 3b 0a 0a  ReStateNumber;..
08d0: 2f 2a 20 42 65 63 61 75 73 65 20 74 68 69 73 20  /* Because this 
08e0: 69 73 20 61 6e 20 4e 46 41 20 61 6e 64 20 6e 6f  is an NFA and no
08f0: 74 20 61 20 44 46 41 2c 20 6d 75 6c 74 69 70 6c  t a DFA, multipl
0900: 65 20 73 74 61 74 65 73 20 63 61 6e 20 62 65 20  e states can be 
0910: 61 63 74 69 76 65 20 61 74 0a 2a 2a 20 6f 6e 63  active at.** onc
0920: 65 2e 20 20 41 6e 20 69 6e 73 74 61 6e 63 65 20  e.  An instance 
0930: 6f 66 20 74 68 65 20 66 6f 6c 6c 6f 77 69 6e 67  of the following
0940: 20 6f 62 6a 65 63 74 20 72 65 63 6f 72 64 73 20   object records 
0950: 61 6c 6c 20 61 63 74 69 76 65 20 73 74 61 74 65  all active state
0960: 73 20 69 6e 0a 2a 2a 20 74 68 65 20 4e 46 41 2e  s in.** the NFA.
0970: 20 20 54 68 65 20 69 6d 70 6c 65 6d 65 6e 74 61    The implementa
0980: 74 69 6f 6e 20 69 73 20 6f 70 74 69 6d 69 7a 65  tion is optimize
0990: 64 20 66 6f 72 20 74 68 65 20 63 6f 6d 6d 6f 6e  d for the common
09a0: 20 63 61 73 65 20 77 68 65 72 65 20 74 68 65 0a   case where the.
09b0: 2a 2a 20 6e 75 6d 62 65 72 20 6f 66 20 61 63 74  ** number of act
09c0: 69 76 65 73 20 73 74 61 74 65 73 20 69 73 20 73  ives states is s
09d0: 6d 61 6c 6c 2e 0a 2a 2f 0a 74 79 70 65 64 65 66  mall..*/.typedef
09e0: 20 73 74 72 75 63 74 20 52 65 53 74 61 74 65 53   struct ReStateS
09f0: 65 74 20 7b 0a 20 20 75 6e 73 69 67 6e 65 64 20  et {.  unsigned 
0a00: 6e 53 74 61 74 65 3b 20 20 20 20 20 20 20 20 20  nState;         
0a10: 20 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f 66 20     /* Number of 
0a20: 63 75 72 72 65 6e 74 20 73 74 61 74 65 73 20 2a  current states *
0a30: 2f 0a 20 20 52 65 53 74 61 74 65 4e 75 6d 62 65  /.  ReStateNumbe
0a40: 72 20 2a 61 53 74 61 74 65 3b 20 20 20 20 20 20  r *aState;      
0a50: 2f 2a 20 43 75 72 72 65 6e 74 20 73 74 61 74 65  /* Current state
0a60: 73 20 2a 2f 0a 7d 20 52 65 53 74 61 74 65 53 65  s */.} ReStateSe
0a70: 74 3b 0a 0a 23 69 66 20 49 4e 54 45 52 46 41 43  t;..#if INTERFAC
0a80: 45 0a 2f 2a 20 41 6e 20 69 6e 70 75 74 20 73 74  E./* An input st
0a90: 72 69 6e 67 20 72 65 61 64 20 6f 6e 65 20 63 68  ring read one ch
0aa0: 61 72 61 63 74 65 72 20 61 74 20 61 20 74 69 6d  aracter at a tim
0ab0: 65 2e 0a 2a 2f 0a 73 74 72 75 63 74 20 52 65 49  e..*/.struct ReI
0ac0: 6e 70 75 74 20 7b 0a 20 20 63 6f 6e 73 74 20 75  nput {.  const u
0ad0: 6e 73 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 3b  nsigned char *z;
0ae0: 20 20 2f 2a 20 41 6c 6c 20 74 65 78 74 20 2a 2f    /* All text */
0af0: 0a 20 20 69 6e 74 20 69 3b 20 20 20 20 20 20 20  .  int i;       
0b00: 20 20 20 20 20 20 20 20 20 20 20 20 2f 2a 20 4e              /* N
0b10: 65 78 74 20 62 79 74 65 20 74 6f 20 72 65 61 64  ext byte to read
0b20: 20 2a 2f 0a 20 20 69 6e 74 20 6d 78 3b 20 20 20   */.  int mx;   
0b30: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 2f                 /
0b40: 2a 20 45 4f 46 20 77 68 65 6e 20 69 3e 3d 6d 78  * EOF when i>=mx
0b50: 20 2a 2f 0a 7d 3b 0a 0a 2f 2a 20 41 20 63 6f 6d   */.};../* A com
0b60: 70 69 6c 65 64 20 4e 46 41 20 28 6f 72 20 61 6e  piled NFA (or an
0b70: 20 4e 46 41 20 74 68 61 74 20 69 73 20 69 6e 20   NFA that is in 
0b80: 74 68 65 20 70 72 6f 63 65 73 73 20 6f 66 20 62  the process of b
0b90: 65 69 6e 67 20 63 6f 6d 70 69 6c 65 64 29 20 69  eing compiled) i
0ba0: 73 0a 2a 2a 20 61 6e 20 69 6e 73 74 61 6e 63 65  s.** an instance
0bb0: 20 6f 66 20 74 68 65 20 66 6f 6c 6c 6f 77 69 6e   of the followin
0bc0: 67 20 6f 62 6a 65 63 74 2e 0a 2a 2f 0a 73 74 72  g object..*/.str
0bd0: 75 63 74 20 52 65 43 6f 6d 70 69 6c 65 64 20 7b  uct ReCompiled {
0be0: 0a 20 20 52 65 49 6e 70 75 74 20 73 49 6e 3b 20  .  ReInput sIn; 
0bf0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 2f                 /
0c00: 2a 20 52 65 67 75 6c 61 72 20 65 78 70 72 65 73  * Regular expres
0c10: 73 69 6f 6e 20 74 65 78 74 20 2a 2f 0a 20 20 63  sion text */.  c
0c20: 6f 6e 73 74 20 63 68 61 72 20 2a 7a 45 72 72 3b  onst char *zErr;
0c30: 20 20 20 20 20 20 20 20 20 20 20 2f 2a 20 45 72             /* Er
0c40: 72 6f 72 20 6d 65 73 73 61 67 65 20 74 6f 20 72  ror message to r
0c50: 65 74 75 72 6e 20 2a 2f 0a 20 20 63 68 61 72 20  eturn */.  char 
0c60: 2a 61 4f 70 3b 20 20 20 20 20 20 20 20 20 20 20  *aOp;           
0c70: 20 20 20 20 20 20 20 2f 2a 20 4f 70 65 72 61 74         /* Operat
0c80: 6f 72 73 20 66 6f 72 20 74 68 65 20 76 69 72 74  ors for the virt
0c90: 75 61 6c 20 6d 61 63 68 69 6e 65 20 2a 2f 0a 20  ual machine */. 
0ca0: 20 69 6e 74 20 2a 61 41 72 67 3b 20 20 20 20 20   int *aArg;     
0cb0: 20 20 20 20 20 20 20 20 20 20 20 20 20 2f 2a 20               /* 
0cc0: 41 72 67 75 6d 65 6e 74 73 20 74 6f 20 65 61 63  Arguments to eac
0cd0: 68 20 6f 70 65 72 61 74 6f 72 20 2a 2f 0a 20 20  h operator */.  
0ce0: 75 6e 73 69 67 6e 65 64 20 28 2a 78 4e 65 78 74  unsigned (*xNext
0cf0: 43 68 61 72 29 28 52 65 49 6e 70 75 74 2a 29 3b  Char)(ReInput*);
0d00: 20 20 2f 2a 20 4e 65 78 74 20 63 68 61 72 61 63    /* Next charac
0d10: 74 65 72 20 66 75 6e 63 74 69 6f 6e 20 2a 2f 0a  ter function */.
0d20: 20 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20    unsigned char 
0d30: 7a 49 6e 69 74 5b 31 32 5d 3b 20 20 20 20 2f 2a  zInit[12];    /*
0d40: 20 49 6e 69 74 69 61 6c 20 74 65 78 74 20 74 6f   Initial text to
0d50: 20 6d 61 74 63 68 20 2a 2f 0a 20 20 69 6e 74 20   match */.  int 
0d60: 6e 49 6e 69 74 3b 20 20 20 20 20 20 20 20 20 20  nInit;          
0d70: 20 20 20 20 20 20 20 20 2f 2a 20 4e 75 6d 62 65          /* Numbe
0d80: 72 20 6f 66 20 63 68 61 72 61 63 74 65 72 73 20  r of characters 
0d90: 69 6e 20 7a 49 6e 69 74 20 2a 2f 0a 20 20 75 6e  in zInit */.  un
0da0: 73 69 67 6e 65 64 20 6e 53 74 61 74 65 3b 20 20  signed nState;  
0db0: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 4e 75 6d            /* Num
0dc0: 62 65 72 20 6f 66 20 65 6e 74 72 69 65 73 20 69  ber of entries i
0dd0: 6e 20 61 4f 70 5b 5d 20 61 6e 64 20 61 41 72 67  n aOp[] and aArg
0de0: 5b 5d 20 2a 2f 0a 20 20 75 6e 73 69 67 6e 65 64  [] */.  unsigned
0df0: 20 6e 41 6c 6c 6f 63 3b 20 20 20 20 20 20 20 20   nAlloc;        
0e00: 20 20 20 20 2f 2a 20 53 6c 6f 74 73 20 61 6c 6c      /* Slots all
0e10: 6f 63 61 74 65 64 20 66 6f 72 20 61 4f 70 5b 5d  ocated for aOp[]
0e20: 20 61 6e 64 20 61 41 72 67 5b 5d 20 2a 2f 0a 7d   and aArg[] */.}
0e30: 3b 0a 23 65 6e 64 69 66 0a 0a 2f 2a 20 41 64 64  ;.#endif../* Add
0e40: 20 61 20 73 74 61 74 65 20 74 6f 20 74 68 65 20   a state to the 
0e50: 67 69 76 65 6e 20 73 74 61 74 65 20 73 65 74 20  given state set 
0e60: 69 66 20 69 74 20 69 73 20 6e 6f 74 20 61 6c 72  if it is not alr
0e70: 65 61 64 79 20 74 68 65 72 65 20 2a 2f 0a 73 74  eady there */.st
0e80: 61 74 69 63 20 76 6f 69 64 20 72 65 5f 61 64 64  atic void re_add
0e90: 5f 73 74 61 74 65 28 52 65 53 74 61 74 65 53 65  _state(ReStateSe
0ea0: 74 20 2a 70 53 65 74 2c 20 69 6e 74 20 6e 65 77  t *pSet, int new
0eb0: 53 74 61 74 65 29 7b 0a 20 20 75 6e 73 69 67 6e  State){.  unsign
0ec0: 65 64 20 69 3b 0a 20 20 66 6f 72 28 69 3d 30 3b  ed i;.  for(i=0;
0ed0: 20 69 3c 70 53 65 74 2d 3e 6e 53 74 61 74 65 3b   i<pSet->nState;
0ee0: 20 69 2b 2b 29 20 69 66 28 20 70 53 65 74 2d 3e   i++) if( pSet->
0ef0: 61 53 74 61 74 65 5b 69 5d 3d 3d 6e 65 77 53 74  aState[i]==newSt
0f00: 61 74 65 20 29 20 72 65 74 75 72 6e 3b 0a 20 20  ate ) return;.  
0f10: 70 53 65 74 2d 3e 61 53 74 61 74 65 5b 70 53 65  pSet->aState[pSe
0f20: 74 2d 3e 6e 53 74 61 74 65 2b 2b 5d 20 3d 20 28  t->nState++] = (
0f30: 52 65 53 74 61 74 65 4e 75 6d 62 65 72 29 6e 65  ReStateNumber)ne
0f40: 77 53 74 61 74 65 3b 0a 7d 0a 0a 2f 2a 20 45 78  wState;.}../* Ex
0f50: 74 72 61 63 74 20 74 68 65 20 6e 65 78 74 20 75  tract the next u
0f60: 6e 69 63 6f 64 65 20 63 68 61 72 61 63 74 65 72  nicode character
0f70: 20 66 72 6f 6d 20 2a 70 7a 49 6e 20 61 6e 64 20   from *pzIn and 
0f80: 72 65 74 75 72 6e 20 69 74 2e 20 20 41 64 76 61  return it.  Adva
0f90: 6e 63 65 0a 2a 2a 20 2a 70 7a 49 6e 20 74 6f 20  nce.** *pzIn to 
0fa0: 74 68 65 20 66 69 72 73 74 20 62 79 74 65 20 70  the first byte p
0fb0: 61 73 74 20 74 68 65 20 65 6e 64 20 6f 66 20 74  ast the end of t
0fc0: 68 65 20 63 68 61 72 61 63 74 65 72 20 72 65 74  he character ret
0fd0: 75 72 6e 65 64 2e 20 20 54 6f 0a 2a 2a 20 62 65  urned.  To.** be
0fe0: 20 63 6c 65 61 72 3a 20 20 74 68 69 73 20 72 6f   clear:  this ro
0ff0: 75 74 69 6e 65 20 63 6f 6e 76 65 72 74 73 20 75  utine converts u
1000: 74 66 38 20 74 6f 20 75 6e 69 63 6f 64 65 2e 20  tf8 to unicode. 
1010: 20 54 68 69 73 20 72 6f 75 74 69 6e 65 20 69 73   This routine is
1020: 0a 2a 2a 20 6f 70 74 69 6d 69 7a 65 64 20 66 6f  .** optimized fo
1030: 72 20 74 68 65 20 63 6f 6d 6d 6f 6e 20 63 61 73  r the common cas
1040: 65 20 77 68 65 72 65 20 74 68 65 20 6e 65 78 74  e where the next
1050: 20 63 68 61 72 61 63 74 65 72 20 69 73 20 61 20   character is a 
1060: 73 69 6e 67 6c 65 20 62 79 74 65 2e 0a 2a 2f 0a  single byte..*/.
1070: 73 74 61 74 69 63 20 75 6e 73 69 67 6e 65 64 20  static unsigned 
1080: 72 65 5f 6e 65 78 74 5f 63 68 61 72 28 52 65 49  re_next_char(ReI
1090: 6e 70 75 74 20 2a 70 29 7b 0a 20 20 75 6e 73 69  nput *p){.  unsi
10a0: 67 6e 65 64 20 63 3b 0a 20 20 69 66 28 20 70 2d  gned c;.  if( p-
10b0: 3e 69 3e 3d 70 2d 3e 6d 78 20 29 20 72 65 74 75  >i>=p->mx ) retu
10c0: 72 6e 20 30 3b 0a 20 20 63 20 3d 20 70 2d 3e 7a  rn 0;.  c = p->z
10d0: 5b 70 2d 3e 69 2b 2b 5d 3b 0a 20 20 69 66 28 20  [p->i++];.  if( 
10e0: 63 3e 3d 30 78 38 30 20 29 7b 0a 20 20 20 20 69  c>=0x80 ){.    i
10f0: 66 28 20 28 63 26 30 78 65 30 29 3d 3d 30 78 63  f( (c&0xe0)==0xc
1100: 30 20 26 26 20 70 2d 3e 69 3c 70 2d 3e 6d 78 20  0 && p->i<p->mx 
1110: 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69 5d 26 30  && (p->z[p->i]&0
1120: 78 63 30 29 3d 3d 30 78 38 30 20 29 7b 0a 20 20  xc0)==0x80 ){.  
1130: 20 20 20 20 63 20 3d 20 28 63 26 30 78 31 66 29      c = (c&0x1f)
1140: 3c 3c 36 20 7c 20 28 70 2d 3e 7a 5b 70 2d 3e 69  <<6 | (p->z[p->i
1150: 2b 2b 5d 26 30 78 33 66 29 3b 0a 20 20 20 20 20  ++]&0x3f);.     
1160: 20 69 66 28 20 63 3c 30 78 38 30 20 29 20 63 20   if( c<0x80 ) c 
1170: 3d 20 30 78 66 66 66 64 3b 0a 20 20 20 20 7d 65  = 0xfffd;.    }e
1180: 6c 73 65 20 69 66 28 20 28 63 26 30 78 66 30 29  lse if( (c&0xf0)
1190: 3d 3d 30 78 65 30 20 26 26 20 70 2d 3e 69 2b 31  ==0xe0 && p->i+1
11a0: 3c 70 2d 3e 6d 78 20 26 26 20 28 70 2d 3e 7a 5b  <p->mx && (p->z[
11b0: 70 2d 3e 69 5d 26 30 78 63 30 29 3d 3d 30 78 38  p->i]&0xc0)==0x8
11c0: 30 0a 20 20 20 20 20 20 20 20 20 20 20 26 26 20  0.           && 
11d0: 28 70 2d 3e 7a 5b 70 2d 3e 69 2b 31 5d 26 30 78  (p->z[p->i+1]&0x
11e0: 63 30 29 3d 3d 30 78 38 30 20 29 7b 0a 20 20 20  c0)==0x80 ){.   
11f0: 20 20 20 63 20 3d 20 28 63 26 30 78 30 66 29 3c     c = (c&0x0f)<
1200: 3c 31 32 20 7c 20 28 28 70 2d 3e 7a 5b 70 2d 3e  <12 | ((p->z[p->
1210: 69 5d 26 30 78 33 66 29 3c 3c 36 29 20 7c 20 28  i]&0x3f)<<6) | (
1220: 70 2d 3e 7a 5b 70 2d 3e 69 2b 31 5d 26 30 78 33  p->z[p->i+1]&0x3
1230: 66 29 3b 0a 20 20 20 20 20 20 70 2d 3e 69 20 2b  f);.      p->i +
1240: 3d 20 32 3b 0a 20 20 20 20 20 20 69 66 28 20 63  = 2;.      if( c
1250: 3c 3d 30 78 33 66 66 20 7c 7c 20 28 63 3e 3d 30  <=0x3ff || (c>=0
1260: 78 64 38 30 30 20 26 26 20 63 3c 3d 30 78 64 66  xd800 && c<=0xdf
1270: 66 66 29 20 29 20 63 20 3d 20 30 78 66 66 66 64  ff) ) c = 0xfffd
1280: 3b 0a 20 20 20 20 7d 65 6c 73 65 20 69 66 28 20  ;.    }else if( 
1290: 28 63 26 30 78 66 38 29 3d 3d 30 78 66 30 20 26  (c&0xf8)==0xf0 &
12a0: 26 20 70 2d 3e 69 2b 33 3c 70 2d 3e 6d 78 20 26  & p->i+3<p->mx &
12b0: 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69 5d 26 30 78  & (p->z[p->i]&0x
12c0: 63 30 29 3d 3d 30 78 38 30 0a 20 20 20 20 20 20  c0)==0x80.      
12d0: 20 20 20 20 20 26 26 20 28 70 2d 3e 7a 5b 70 2d       && (p->z[p-
12e0: 3e 69 2b 31 5d 26 30 78 63 30 29 3d 3d 30 78 38  >i+1]&0xc0)==0x8
12f0: 30 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b  0 && (p->z[p->i+
1300: 32 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 20 29  2]&0xc0)==0x80 )
1310: 7b 0a 20 20 20 20 20 20 63 20 3d 20 28 63 26 30  {.      c = (c&0
1320: 78 30 37 29 3c 3c 31 38 20 7c 20 28 28 70 2d 3e  x07)<<18 | ((p->
1330: 7a 5b 70 2d 3e 69 5d 26 30 78 33 66 29 3c 3c 31  z[p->i]&0x3f)<<1
1340: 32 29 20 7c 20 28 28 70 2d 3e 7a 5b 70 2d 3e 69  2) | ((p->z[p->i
1350: 2b 31 5d 26 30 78 33 66 29 3c 3c 36 29 0a 20 20  +1]&0x3f)<<6).  
1360: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1370: 20 20 20 20 20 7c 20 28 70 2d 3e 7a 5b 70 2d 3e       | (p->z[p->
1380: 69 2b 32 5d 26 30 78 33 66 29 3b 0a 20 20 20 20  i+2]&0x3f);.    
1390: 20 20 70 2d 3e 69 20 2b 3d 20 33 3b 0a 20 20 20    p->i += 3;.   
13a0: 20 20 20 69 66 28 20 63 3c 3d 30 78 66 66 66 66     if( c<=0xffff
13b0: 20 7c 7c 20 63 3e 30 78 31 30 66 66 66 66 20 29   || c>0x10ffff )
13c0: 20 63 20 3d 20 30 78 66 66 66 64 3b 0a 20 20 20   c = 0xfffd;.   
13d0: 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20 63 20   }else{.      c 
13e0: 3d 20 30 78 66 66 66 64 3b 0a 20 20 20 20 7d 0a  = 0xfffd;.    }.
13f0: 20 20 7d 0a 20 20 72 65 74 75 72 6e 20 63 3b 0a    }.  return c;.
1400: 7d 0a 73 74 61 74 69 63 20 75 6e 73 69 67 6e 65  }.static unsigne
1410: 64 20 72 65 5f 6e 65 78 74 5f 63 68 61 72 5f 6e  d re_next_char_n
1420: 6f 63 61 73 65 28 52 65 49 6e 70 75 74 20 2a 70  ocase(ReInput *p
1430: 29 7b 0a 20 20 75 6e 73 69 67 6e 65 64 20 63 20  ){.  unsigned c 
1440: 3d 20 72 65 5f 6e 65 78 74 5f 63 68 61 72 28 70  = re_next_char(p
1450: 29 3b 0a 20 20 72 65 74 75 72 6e 20 75 6e 69 63  );.  return unic
1460: 6f 64 65 5f 66 6f 6c 64 28 63 2c 32 29 3b 0a 7d  ode_fold(c,2);.}
1470: 0a 0a 2f 2a 20 52 65 74 75 72 6e 20 74 72 75 65  ../* Return true
1480: 20 69 66 20 63 20 69 73 20 61 20 70 65 72 6c 20   if c is a perl 
1490: 22 77 6f 72 64 22 20 63 68 61 72 61 63 74 65 72  "word" character
14a0: 3a 20 20 5b 41 2d 5a 61 2d 7a 30 2d 39 5f 5d 20  :  [A-Za-z0-9_] 
14b0: 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74 20 72 65  */.static int re
14c0: 5f 77 6f 72 64 5f 63 68 61 72 28 69 6e 74 20 63  _word_char(int c
14d0: 29 7b 0a 20 20 72 65 74 75 72 6e 20 75 6e 69 63  ){.  return unic
14e0: 6f 64 65 5f 69 73 61 6c 6e 75 6d 28 63 29 20 7c  ode_isalnum(c) |
14f0: 7c 20 63 3d 3d 27 5f 27 3b 0a 7d 0a 0a 2f 2a 20  | c=='_';.}../* 
1500: 52 65 74 75 72 6e 20 74 72 75 65 20 69 66 20 63  Return true if c
1510: 20 69 73 20 61 20 22 64 69 67 69 74 22 20 63 68   is a "digit" ch
1520: 61 72 61 63 74 65 72 3a 20 20 5b 30 2d 39 5d 20  aracter:  [0-9] 
1530: 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74 20 72 65  */.static int re
1540: 5f 64 69 67 69 74 5f 63 68 61 72 28 69 6e 74 20  _digit_char(int 
1550: 63 29 7b 0a 20 20 72 65 74 75 72 6e 20 28 63 3e  c){.  return (c>
1560: 3d 27 30 27 20 26 26 20 63 3c 3d 27 39 27 29 3b  ='0' && c<='9');
1570: 0a 7d 0a 0a 2f 2a 20 52 65 74 75 72 6e 20 74 72  .}../* Return tr
1580: 75 65 20 69 66 20 63 20 69 73 20 61 20 70 65 72  ue if c is a per
1590: 6c 20 22 73 70 61 63 65 22 20 63 68 61 72 61 63  l "space" charac
15a0: 74 65 72 3a 20 20 5b 20 5c 74 5c 72 5c 6e 5c 76  ter:  [ \t\r\n\v
15b0: 5c 66 5d 20 2a 2f 0a 73 74 61 74 69 63 20 69 6e  \f] */.static in
15c0: 74 20 72 65 5f 73 70 61 63 65 5f 63 68 61 72 28  t re_space_char(
15d0: 69 6e 74 20 63 29 7b 0a 20 20 72 65 74 75 72 6e  int c){.  return
15e0: 20 63 3d 3d 27 20 27 20 7c 7c 20 63 3d 3d 27 5c   c==' ' || c=='\
15f0: 74 27 20 7c 7c 20 63 3d 3d 27 5c 6e 27 20 7c 7c  t' || c=='\n' ||
1600: 20 63 3d 3d 27 5c 72 27 20 7c 7c 20 63 3d 3d 27   c=='\r' || c=='
1610: 5c 76 27 20 7c 7c 20 63 3d 3d 27 5c 66 27 3b 0a  \v' || c=='\f';.
1620: 7d 0a 0a 2f 2a 20 52 75 6e 20 61 20 63 6f 6d 70  }../* Run a comp
1630: 69 6c 65 64 20 72 65 67 75 6c 61 72 20 65 78 70  iled regular exp
1640: 72 65 73 73 69 6f 6e 20 6f 6e 20 74 68 65 20 7a  ression on the z
1650: 65 72 6f 2d 74 65 72 6d 69 6e 61 74 65 64 20 69  ero-terminated i
1660: 6e 70 75 74 0a 2a 2a 20 73 74 72 69 6e 67 20 7a  nput.** string z
1670: 49 6e 5b 5d 2e 20 20 52 65 74 75 72 6e 20 74 72  In[].  Return tr
1680: 75 65 20 6f 6e 20 61 20 6d 61 74 63 68 20 61 6e  ue on a match an
1690: 64 20 66 61 6c 73 65 20 69 66 20 74 68 65 72 65  d false if there
16a0: 20 69 73 20 6e 6f 20 6d 61 74 63 68 2e 0a 2a 2f   is no match..*/
16b0: 0a 69 6e 74 20 72 65 5f 6d 61 74 63 68 28 52 65  .int re_match(Re
16c0: 43 6f 6d 70 69 6c 65 64 20 2a 70 52 65 2c 20 63  Compiled *pRe, c
16d0: 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 20 63 68  onst unsigned ch
16e0: 61 72 20 2a 7a 49 6e 2c 20 69 6e 74 20 6e 49 6e  ar *zIn, int nIn
16f0: 29 7b 0a 20 20 52 65 53 74 61 74 65 53 65 74 20  ){.  ReStateSet 
1700: 61 53 74 61 74 65 53 65 74 5b 32 5d 2c 20 2a 70  aStateSet[2], *p
1710: 54 68 69 73 2c 20 2a 70 4e 65 78 74 3b 0a 20 20  This, *pNext;.  
1720: 52 65 53 74 61 74 65 4e 75 6d 62 65 72 20 61 53  ReStateNumber aS
1730: 70 61 63 65 5b 31 30 30 5d 3b 0a 20 20 52 65 53  pace[100];.  ReS
1740: 74 61 74 65 4e 75 6d 62 65 72 20 2a 70 54 6f 46  tateNumber *pToF
1750: 72 65 65 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20  ree;.  unsigned 
1760: 69 6e 74 20 69 20 3d 20 30 3b 0a 20 20 75 6e 73  int i = 0;.  uns
1770: 69 67 6e 65 64 20 69 6e 74 20 69 53 77 61 70 20  igned int iSwap 
1780: 3d 20 30 3b 0a 20 20 69 6e 74 20 63 20 3d 20 52  = 0;.  int c = R
1790: 45 5f 45 4f 46 2b 31 3b 0a 20 20 69 6e 74 20 63  E_EOF+1;.  int c
17a0: 50 72 65 76 20 3d 20 30 3b 0a 20 20 69 6e 74 20  Prev = 0;.  int 
17b0: 72 63 20 3d 20 30 3b 0a 20 20 52 65 49 6e 70 75  rc = 0;.  ReInpu
17c0: 74 20 69 6e 3b 0a 0a 20 20 69 6e 2e 7a 20 3d 20  t in;..  in.z = 
17d0: 7a 49 6e 3b 0a 20 20 69 6e 2e 69 20 3d 20 30 3b  zIn;.  in.i = 0;
17e0: 0a 20 20 69 6e 2e 6d 78 20 3d 20 6e 49 6e 3e 3d  .  in.mx = nIn>=
17f0: 30 20 3f 20 6e 49 6e 20 3a 20 28 69 6e 74 29 73  0 ? nIn : (int)s
1800: 74 72 6c 65 6e 28 28 63 68 61 72 20 63 6f 6e 73  trlen((char cons
1810: 74 2a 29 7a 49 6e 29 3b 0a 0a 20 20 2f 2a 20 4c  t*)zIn);..  /* L
1820: 6f 6f 6b 20 66 6f 72 20 74 68 65 20 69 6e 69 74  ook for the init
1830: 69 61 6c 20 70 72 65 66 69 78 20 6d 61 74 63 68  ial prefix match
1840: 2c 20 69 66 20 74 68 65 72 65 20 69 73 20 6f 6e  , if there is on
1850: 65 2e 20 2a 2f 0a 20 20 69 66 28 20 70 52 65 2d  e. */.  if( pRe-
1860: 3e 6e 49 6e 69 74 20 29 7b 0a 20 20 20 20 75 6e  >nInit ){.    un
1870: 73 69 67 6e 65 64 20 63 68 61 72 20 78 20 3d 20  signed char x = 
1880: 70 52 65 2d 3e 7a 49 6e 69 74 5b 30 5d 3b 0a 20  pRe->zInit[0];. 
1890: 20 20 20 77 68 69 6c 65 28 20 69 6e 2e 69 2b 70     while( in.i+p
18a0: 52 65 2d 3e 6e 49 6e 69 74 3c 3d 69 6e 2e 6d 78  Re->nInit<=in.mx
18b0: 0a 20 20 20 20 20 26 26 20 28 7a 49 6e 5b 69 6e  .     && (zIn[in
18c0: 2e 69 5d 21 3d 78 20 7c 7c 0a 20 20 20 20 20 20  .i]!=x ||.      
18d0: 20 20 20 73 74 72 6e 63 6d 70 28 28 63 6f 6e 73     strncmp((cons
18e0: 74 20 63 68 61 72 2a 29 7a 49 6e 2b 69 6e 2e 69  t char*)zIn+in.i
18f0: 2c 20 28 63 6f 6e 73 74 20 63 68 61 72 2a 29 70  , (const char*)p
1900: 52 65 2d 3e 7a 49 6e 69 74 2c 20 70 52 65 2d 3e  Re->zInit, pRe->
1910: 6e 49 6e 69 74 29 21 3d 30 29 0a 20 20 20 20 29  nInit)!=0).    )
1920: 7b 0a 20 20 20 20 20 20 69 6e 2e 69 2b 2b 3b 0a  {.      in.i++;.
1930: 20 20 20 20 7d 0a 20 20 20 20 69 66 28 20 69 6e      }.    if( in
1940: 2e 69 2b 70 52 65 2d 3e 6e 49 6e 69 74 3e 69 6e  .i+pRe->nInit>in
1950: 2e 6d 78 20 29 20 72 65 74 75 72 6e 20 30 3b 0a  .mx ) return 0;.
1960: 20 20 7d 0a 0a 20 20 69 66 28 20 70 52 65 2d 3e    }..  if( pRe->
1970: 6e 53 74 61 74 65 3c 3d 28 73 69 7a 65 6f 66 28  nState<=(sizeof(
1980: 61 53 70 61 63 65 29 2f 28 73 69 7a 65 6f 66 28  aSpace)/(sizeof(
1990: 61 53 70 61 63 65 5b 30 5d 29 2a 32 29 29 20 29  aSpace[0])*2)) )
19a0: 7b 0a 20 20 20 20 70 54 6f 46 72 65 65 20 3d 20  {.    pToFree = 
19b0: 30 3b 0a 20 20 20 20 61 53 74 61 74 65 53 65 74  0;.    aStateSet
19c0: 5b 30 5d 2e 61 53 74 61 74 65 20 3d 20 61 53 70  [0].aState = aSp
19d0: 61 63 65 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20 20  ace;.  }else{.  
19e0: 20 20 70 54 6f 46 72 65 65 20 3d 20 66 6f 73 73    pToFree = foss
19f0: 69 6c 5f 6d 61 6c 6c 6f 63 28 20 73 69 7a 65 6f  il_malloc( sizeo
1a00: 66 28 52 65 53 74 61 74 65 4e 75 6d 62 65 72 29  f(ReStateNumber)
1a10: 2a 32 2a 70 52 65 2d 3e 6e 53 74 61 74 65 20 29  *2*pRe->nState )
1a20: 3b 0a 20 20 20 20 69 66 28 20 70 54 6f 46 72 65  ;.    if( pToFre
1a30: 65 3d 3d 30 20 29 20 72 65 74 75 72 6e 20 2d 31  e==0 ) return -1
1a40: 3b 0a 20 20 20 20 61 53 74 61 74 65 53 65 74 5b  ;.    aStateSet[
1a50: 30 5d 2e 61 53 74 61 74 65 20 3d 20 70 54 6f 46  0].aState = pToF
1a60: 72 65 65 3b 0a 20 20 7d 0a 20 20 61 53 74 61 74  ree;.  }.  aStat
1a70: 65 53 65 74 5b 31 5d 2e 61 53 74 61 74 65 20 3d  eSet[1].aState =
1a80: 20 26 61 53 74 61 74 65 53 65 74 5b 30 5d 2e 61   &aStateSet[0].a
1a90: 53 74 61 74 65 5b 70 52 65 2d 3e 6e 53 74 61 74  State[pRe->nStat
1aa0: 65 5d 3b 0a 20 20 70 4e 65 78 74 20 3d 20 26 61  e];.  pNext = &a
1ab0: 53 74 61 74 65 53 65 74 5b 31 5d 3b 0a 20 20 70  StateSet[1];.  p
1ac0: 4e 65 78 74 2d 3e 6e 53 74 61 74 65 20 3d 20 30  Next->nState = 0
1ad0: 3b 0a 20 20 72 65 5f 61 64 64 5f 73 74 61 74 65  ;.  re_add_state
1ae0: 28 70 4e 65 78 74 2c 20 30 29 3b 0a 20 20 77 68  (pNext, 0);.  wh
1af0: 69 6c 65 28 20 63 21 3d 52 45 5f 45 4f 46 20 26  ile( c!=RE_EOF &
1b00: 26 20 70 4e 65 78 74 2d 3e 6e 53 74 61 74 65 3e  & pNext->nState>
1b10: 30 20 29 7b 0a 20 20 20 20 63 50 72 65 76 20 3d  0 ){.    cPrev =
1b20: 20 63 3b 0a 20 20 20 20 63 20 3d 20 70 52 65 2d   c;.    c = pRe-
1b30: 3e 78 4e 65 78 74 43 68 61 72 28 26 69 6e 29 3b  >xNextChar(&in);
1b40: 0a 20 20 20 20 70 54 68 69 73 20 3d 20 70 4e 65  .    pThis = pNe
1b50: 78 74 3b 0a 20 20 20 20 70 4e 65 78 74 20 3d 20  xt;.    pNext = 
1b60: 26 61 53 74 61 74 65 53 65 74 5b 69 53 77 61 70  &aStateSet[iSwap
1b70: 5d 3b 0a 20 20 20 20 69 53 77 61 70 20 3d 20 31  ];.    iSwap = 1
1b80: 20 2d 20 69 53 77 61 70 3b 0a 20 20 20 20 70 4e   - iSwap;.    pN
1b90: 65 78 74 2d 3e 6e 53 74 61 74 65 20 3d 20 30 3b  ext->nState = 0;
1ba0: 0a 20 20 20 20 66 6f 72 28 69 3d 30 3b 20 69 3c  .    for(i=0; i<
1bb0: 70 54 68 69 73 2d 3e 6e 53 74 61 74 65 3b 20 69  pThis->nState; i
1bc0: 2b 2b 29 7b 0a 20 20 20 20 20 20 69 6e 74 20 78  ++){.      int x
1bd0: 20 3d 20 70 54 68 69 73 2d 3e 61 53 74 61 74 65   = pThis->aState
1be0: 5b 69 5d 3b 0a 20 20 20 20 20 20 73 77 69 74 63  [i];.      switc
1bf0: 68 28 20 70 52 65 2d 3e 61 4f 70 5b 78 5d 20 29  h( pRe->aOp[x] )
1c00: 7b 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52  {.        case R
1c10: 45 5f 4f 50 5f 4d 41 54 43 48 3a 20 7b 0a 20 20  E_OP_MATCH: {.  
1c20: 20 20 20 20 20 20 20 20 69 66 28 20 70 52 65 2d          if( pRe-
1c30: 3e 61 41 72 67 5b 78 5d 3d 3d 63 20 29 20 72 65  >aArg[x]==c ) re
1c40: 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74  _add_state(pNext
1c50: 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20  , x+1);.        
1c60: 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20    break;.       
1c70: 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65 20   }.        case 
1c80: 52 45 5f 4f 50 5f 41 4e 59 3a 20 7b 0a 20 20 20  RE_OP_ANY: {.   
1c90: 20 20 20 20 20 20 20 72 65 5f 61 64 64 5f 73 74         re_add_st
1ca0: 61 74 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b  ate(pNext, x+1);
1cb0: 0a 20 20 20 20 20 20 20 20 20 20 62 72 65 61 6b  .          break
1cc0: 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20  ;.        }.    
1cd0: 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 57      case RE_OP_W
1ce0: 4f 52 44 3a 20 7b 0a 20 20 20 20 20 20 20 20 20  ORD: {.         
1cf0: 20 69 66 28 20 72 65 5f 77 6f 72 64 5f 63 68 61   if( re_word_cha
1d00: 72 28 63 29 20 29 20 72 65 5f 61 64 64 5f 73 74  r(c) ) re_add_st
1d10: 61 74 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b  ate(pNext, x+1);
1d20: 0a 20 20 20 20 20 20 20 20 20 20 62 72 65 61 6b  .          break
1d30: 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20  ;.        }.    
1d40: 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 4e      case RE_OP_N
1d50: 4f 54 57 4f 52 44 3a 20 7b 0a 20 20 20 20 20 20  OTWORD: {.      
1d60: 20 20 20 20 69 66 28 20 21 72 65 5f 77 6f 72 64      if( !re_word
1d70: 5f 63 68 61 72 28 63 29 20 29 20 72 65 5f 61 64  _char(c) ) re_ad
1d80: 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c 20 78  d_state(pNext, x
1d90: 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20 20 62  +1);.          b
1da0: 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a  reak;.        }.
1db0: 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45 5f          case RE_
1dc0: 4f 50 5f 44 49 47 49 54 3a 20 7b 0a 20 20 20 20  OP_DIGIT: {.    
1dd0: 20 20 20 20 20 20 69 66 28 20 72 65 5f 64 69 67        if( re_dig
1de0: 69 74 5f 63 68 61 72 28 63 29 20 29 20 72 65 5f  it_char(c) ) re_
1df0: 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c  add_state(pNext,
1e00: 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20   x+1);.         
1e10: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20   break;.        
1e20: 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52  }.        case R
1e30: 45 5f 4f 50 5f 4e 4f 54 44 49 47 49 54 3a 20 7b  E_OP_NOTDIGIT: {
1e40: 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20 21  .          if( !
1e50: 72 65 5f 64 69 67 69 74 5f 63 68 61 72 28 63 29  re_digit_char(c)
1e60: 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28   ) re_add_state(
1e70: 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20  pNext, x+1);.   
1e80: 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20         break;.  
1e90: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20        }.        
1ea0: 63 61 73 65 20 52 45 5f 4f 50 5f 53 50 41 43 45  case RE_OP_SPACE
1eb0: 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66  : {.          if
1ec0: 28 20 72 65 5f 73 70 61 63 65 5f 63 68 61 72 28  ( re_space_char(
1ed0: 63 29 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74  c) ) re_add_stat
1ee0: 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20  e(pNext, x+1);. 
1ef0: 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a           break;.
1f00: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
1f10: 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 4e 4f 54    case RE_OP_NOT
1f20: 53 50 41 43 45 3a 20 7b 0a 20 20 20 20 20 20 20  SPACE: {.       
1f30: 20 20 20 69 66 28 20 21 72 65 5f 73 70 61 63 65     if( !re_space
1f40: 5f 63 68 61 72 28 63 29 20 29 20 72 65 5f 61 64  _char(c) ) re_ad
1f50: 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c 20 78  d_state(pNext, x
1f60: 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20 20 62  +1);.          b
1f70: 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a  reak;.        }.
1f80: 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45 5f          case RE_
1f90: 4f 50 5f 42 4f 55 4e 44 41 52 59 3a 20 7b 0a 20  OP_BOUNDARY: {. 
1fa0: 20 20 20 20 20 20 20 20 20 69 66 28 20 72 65 5f           if( re_
1fb0: 77 6f 72 64 5f 63 68 61 72 28 63 29 21 3d 72 65  word_char(c)!=re
1fc0: 5f 77 6f 72 64 5f 63 68 61 72 28 63 50 72 65 76  _word_char(cPrev
1fd0: 29 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74 65  ) ) re_add_state
1fe0: 28 70 54 68 69 73 2c 20 78 2b 31 29 3b 0a 20 20  (pThis, x+1);.  
1ff0: 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20          break;. 
2000: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20         }.       
2010: 20 63 61 73 65 20 52 45 5f 4f 50 5f 41 4e 59 53   case RE_OP_ANYS
2020: 54 41 52 3a 20 7b 0a 20 20 20 20 20 20 20 20 20  TAR: {.         
2030: 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e   re_add_state(pN
2040: 65 78 74 2c 20 78 29 3b 0a 20 20 20 20 20 20 20  ext, x);.       
2050: 20 20 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28     re_add_state(
2060: 70 54 68 69 73 2c 20 78 2b 31 29 3b 0a 20 20 20  pThis, x+1);.   
2070: 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20         break;.  
2080: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20        }.        
2090: 63 61 73 65 20 52 45 5f 4f 50 5f 46 4f 52 4b 3a  case RE_OP_FORK:
20a0: 20 7b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f   {.          re_
20b0: 61 64 64 5f 73 74 61 74 65 28 70 54 68 69 73 2c  add_state(pThis,
20c0: 20 78 2b 70 52 65 2d 3e 61 41 72 67 5b 78 5d 29   x+pRe->aArg[x])
20d0: 3b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61  ;.          re_a
20e0: 64 64 5f 73 74 61 74 65 28 70 54 68 69 73 2c 20  dd_state(pThis, 
20f0: 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20 20  x+1);.          
2100: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d  break;.        }
2110: 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45  .        case RE
2120: 5f 4f 50 5f 47 4f 54 4f 3a 20 7b 0a 20 20 20 20  _OP_GOTO: {.    
2130: 20 20 20 20 20 20 72 65 5f 61 64 64 5f 73 74 61        re_add_sta
2140: 74 65 28 70 54 68 69 73 2c 20 78 2b 70 52 65 2d  te(pThis, x+pRe-
2150: 3e 61 41 72 67 5b 78 5d 29 3b 0a 20 20 20 20 20  >aArg[x]);.     
2160: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
2170: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61      }.        ca
2180: 73 65 20 52 45 5f 4f 50 5f 41 43 43 45 50 54 3a  se RE_OP_ACCEPT:
2190: 20 7b 0a 20 20 20 20 20 20 20 20 20 20 72 63 20   {.          rc 
21a0: 3d 20 31 3b 0a 20 20 20 20 20 20 20 20 20 20 67  = 1;.          g
21b0: 6f 74 6f 20 72 65 5f 6d 61 74 63 68 5f 65 6e 64  oto re_match_end
21c0: 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20  ;.        }.    
21d0: 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 43      case RE_OP_C
21e0: 43 5f 49 4e 43 3a 0a 20 20 20 20 20 20 20 20 63  C_INC:.        c
21f0: 61 73 65 20 52 45 5f 4f 50 5f 43 43 5f 45 58 43  ase RE_OP_CC_EXC
2200: 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20 69 6e  : {.          in
2210: 74 20 6a 20 3d 20 31 3b 0a 20 20 20 20 20 20 20  t j = 1;.       
2220: 20 20 20 69 6e 74 20 6e 20 3d 20 70 52 65 2d 3e     int n = pRe->
2230: 61 41 72 67 5b 78 5d 3b 0a 20 20 20 20 20 20 20  aArg[x];.       
2240: 20 20 20 69 6e 74 20 68 69 74 20 3d 20 30 3b 0a     int hit = 0;.
2250: 20 20 20 20 20 20 20 20 20 20 66 6f 72 28 6a 3d            for(j=
2260: 31 3b 20 6a 3e 30 20 26 26 20 6a 3c 6e 3b 20 6a  1; j>0 && j<n; j
2270: 2b 2b 29 7b 0a 20 20 20 20 20 20 20 20 20 20 20  ++){.           
2280: 20 69 66 28 20 70 52 65 2d 3e 61 4f 70 5b 78 2b   if( pRe->aOp[x+
2290: 6a 5d 3d 3d 52 45 5f 4f 50 5f 43 43 5f 56 41 4c  j]==RE_OP_CC_VAL
22a0: 55 45 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20  UE ){.          
22b0: 20 20 20 20 69 66 28 20 70 52 65 2d 3e 61 41 72      if( pRe->aAr
22c0: 67 5b 78 2b 6a 5d 3d 3d 63 20 29 7b 0a 20 20 20  g[x+j]==c ){.   
22d0: 20 20 20 20 20 20 20 20 20 20 20 20 20 68 69 74               hit
22e0: 20 3d 20 31 3b 0a 20 20 20 20 20 20 20 20 20 20   = 1;.          
22f0: 20 20 20 20 20 20 6a 20 3d 20 2d 31 3b 0a 20 20        j = -1;.  
2300: 20 20 20 20 20 20 20 20 20 20 20 20 7d 0a 20 20              }.  
2310: 20 20 20 20 20 20 20 20 20 20 7d 65 6c 73 65 7b            }else{
2320: 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20 69  .              i
2330: 66 28 20 70 52 65 2d 3e 61 41 72 67 5b 78 2b 6a  f( pRe->aArg[x+j
2340: 5d 3c 3d 63 20 26 26 20 70 52 65 2d 3e 61 41 72  ]<=c && pRe->aAr
2350: 67 5b 78 2b 6a 2b 31 5d 3e 3d 63 20 29 7b 0a 20  g[x+j+1]>=c ){. 
2360: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 68                 h
2370: 69 74 20 3d 20 31 3b 0a 20 20 20 20 20 20 20 20  it = 1;.        
2380: 20 20 20 20 20 20 20 20 6a 20 3d 20 2d 31 3b 0a          j = -1;.
2390: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 7d 65                }e
23a0: 6c 73 65 7b 0a 20 20 20 20 20 20 20 20 20 20 20  lse{.           
23b0: 20 20 20 20 20 6a 2b 2b 3b 0a 20 20 20 20 20 20       j++;.      
23c0: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
23d0: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20        }.        
23e0: 20 20 7d 0a 20 20 20 20 20 20 20 20 20 20 69 66    }.          if
23f0: 28 20 70 52 65 2d 3e 61 4f 70 5b 78 5d 3d 3d 52  ( pRe->aOp[x]==R
2400: 45 5f 4f 50 5f 43 43 5f 45 58 43 20 29 20 68 69  E_OP_CC_EXC ) hi
2410: 74 20 3d 20 21 68 69 74 3b 0a 20 20 20 20 20 20  t = !hit;.      
2420: 20 20 20 20 69 66 28 20 68 69 74 20 29 20 72 65      if( hit ) re
2430: 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74  _add_state(pNext
2440: 2c 20 78 2b 6e 29 3b 0a 20 20 20 20 20 20 20 20  , x+n);.        
2450: 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20    break;.       
2460: 20 7d 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 7d   }.      }.    }
2470: 0a 20 20 7d 0a 20 20 66 6f 72 28 69 3d 30 3b 20  .  }.  for(i=0; 
2480: 69 3c 70 4e 65 78 74 2d 3e 6e 53 74 61 74 65 3b  i<pNext->nState;
2490: 20 69 2b 2b 29 7b 0a 20 20 20 20 69 66 28 20 70   i++){.    if( p
24a0: 52 65 2d 3e 61 4f 70 5b 70 4e 65 78 74 2d 3e 61  Re->aOp[pNext->a
24b0: 53 74 61 74 65 5b 69 5d 5d 3d 3d 52 45 5f 4f 50  State[i]]==RE_OP
24c0: 5f 41 43 43 45 50 54 20 29 7b 20 72 63 20 3d 20  _ACCEPT ){ rc = 
24d0: 31 3b 20 62 72 65 61 6b 3b 20 7d 0a 20 20 7d 0a  1; break; }.  }.
24e0: 72 65 5f 6d 61 74 63 68 5f 65 6e 64 3a 0a 20 20  re_match_end:.  
24f0: 66 6f 73 73 69 6c 5f 66 72 65 65 28 70 54 6f 46  fossil_free(pToF
2500: 72 65 65 29 3b 0a 20 20 72 65 74 75 72 6e 20 72  ree);.  return r
2510: 63 3b 0a 7d 0a 0a 2f 2a 20 52 65 73 69 7a 65 20  c;.}../* Resize 
2520: 74 68 65 20 6f 70 63 6f 64 65 20 61 6e 64 20 61  the opcode and a
2530: 72 67 75 6d 65 6e 74 20 61 72 72 61 79 73 20 66  rgument arrays f
2540: 6f 72 20 61 6e 20 52 45 20 75 6e 64 65 72 20 63  or an RE under c
2550: 6f 6e 73 74 72 75 63 74 69 6f 6e 2e 0a 2a 2f 0a  onstruction..*/.
2560: 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f 72 65  static int re_re
2570: 73 69 7a 65 28 52 65 43 6f 6d 70 69 6c 65 64 20  size(ReCompiled 
2580: 2a 70 2c 20 69 6e 74 20 4e 29 7b 0a 20 20 63 68  *p, int N){.  ch
2590: 61 72 20 2a 61 4f 70 3b 0a 20 20 69 6e 74 20 2a  ar *aOp;.  int *
25a0: 61 41 72 67 3b 0a 20 20 61 4f 70 20 3d 20 66 6f  aArg;.  aOp = fo
25b0: 73 73 69 6c 5f 72 65 61 6c 6c 6f 63 28 70 2d 3e  ssil_realloc(p->
25c0: 61 4f 70 2c 20 4e 2a 73 69 7a 65 6f 66 28 70 2d  aOp, N*sizeof(p-
25d0: 3e 61 4f 70 5b 30 5d 29 29 3b 0a 20 20 69 66 28  >aOp[0]));.  if(
25e0: 20 61 4f 70 3d 3d 30 20 29 20 72 65 74 75 72 6e   aOp==0 ) return
25f0: 20 31 3b 0a 20 20 70 2d 3e 61 4f 70 20 3d 20 61   1;.  p->aOp = a
2600: 4f 70 3b 0a 20 20 61 41 72 67 20 3d 20 66 6f 73  Op;.  aArg = fos
2610: 73 69 6c 5f 72 65 61 6c 6c 6f 63 28 70 2d 3e 61  sil_realloc(p->a
2620: 41 72 67 2c 20 4e 2a 73 69 7a 65 6f 66 28 70 2d  Arg, N*sizeof(p-
2630: 3e 61 41 72 67 5b 30 5d 29 29 3b 0a 20 20 69 66  >aArg[0]));.  if
2640: 28 20 61 41 72 67 3d 3d 30 20 29 20 72 65 74 75  ( aArg==0 ) retu
2650: 72 6e 20 31 3b 0a 20 20 70 2d 3e 61 41 72 67 20  rn 1;.  p->aArg 
2660: 3d 20 61 41 72 67 3b 0a 20 20 70 2d 3e 6e 41 6c  = aArg;.  p->nAl
2670: 6c 6f 63 20 3d 20 4e 3b 0a 20 20 72 65 74 75 72  loc = N;.  retur
2680: 6e 20 30 3b 0a 7d 0a 0a 2f 2a 20 49 6e 73 65 72  n 0;.}../* Inser
2690: 74 20 61 20 6e 65 77 20 6f 70 63 6f 64 65 20 61  t a new opcode a
26a0: 6e 64 20 61 72 67 75 6d 65 6e 74 20 69 6e 74 6f  nd argument into
26b0: 20 61 6e 20 52 45 20 75 6e 64 65 72 20 63 6f 6e   an RE under con
26c0: 73 74 72 75 63 74 69 6f 6e 2e 20 20 54 68 65 0a  struction.  The.
26d0: 2a 2a 20 69 6e 73 65 72 74 69 6f 6e 20 70 6f 69  ** insertion poi
26e0: 6e 74 20 69 73 20 6a 75 73 74 20 70 72 69 6f 72  nt is just prior
26f0: 20 74 6f 20 65 78 69 73 74 69 6e 67 20 6f 70 63   to existing opc
2700: 6f 64 65 20 69 42 65 66 6f 72 65 2e 0a 2a 2f 0a  ode iBefore..*/.
2710: 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f 69 6e  static int re_in
2720: 73 65 72 74 28 52 65 43 6f 6d 70 69 6c 65 64 20  sert(ReCompiled 
2730: 2a 70 2c 20 69 6e 74 20 69 42 65 66 6f 72 65 2c  *p, int iBefore,
2740: 20 69 6e 74 20 6f 70 2c 20 69 6e 74 20 61 72 67   int op, int arg
2750: 29 7b 0a 20 20 69 6e 74 20 69 3b 0a 20 20 69 66  ){.  int i;.  if
2760: 28 20 70 2d 3e 6e 41 6c 6c 6f 63 3c 3d 70 2d 3e  ( p->nAlloc<=p->
2770: 6e 53 74 61 74 65 20 26 26 20 72 65 5f 72 65 73  nState && re_res
2780: 69 7a 65 28 70 2c 20 70 2d 3e 6e 41 6c 6c 6f 63  ize(p, p->nAlloc
2790: 2a 32 29 20 29 20 72 65 74 75 72 6e 20 30 3b 0a  *2) ) return 0;.
27a0: 20 20 66 6f 72 28 69 3d 70 2d 3e 6e 53 74 61 74    for(i=p->nStat
27b0: 65 3b 20 69 3e 69 42 65 66 6f 72 65 3b 20 69 2d  e; i>iBefore; i-
27c0: 2d 29 7b 0a 20 20 20 20 70 2d 3e 61 4f 70 5b 69  -){.    p->aOp[i
27d0: 5d 20 3d 20 70 2d 3e 61 4f 70 5b 69 2d 31 5d 3b  ] = p->aOp[i-1];
27e0: 0a 20 20 20 20 70 2d 3e 61 41 72 67 5b 69 5d 20  .    p->aArg[i] 
27f0: 3d 20 70 2d 3e 61 41 72 67 5b 69 2d 31 5d 3b 0a  = p->aArg[i-1];.
2800: 20 20 7d 0a 20 20 70 2d 3e 6e 53 74 61 74 65 2b    }.  p->nState+
2810: 2b 3b 0a 20 20 70 2d 3e 61 4f 70 5b 69 42 65 66  +;.  p->aOp[iBef
2820: 6f 72 65 5d 20 3d 20 28 63 68 61 72 29 6f 70 3b  ore] = (char)op;
2830: 0a 20 20 70 2d 3e 61 41 72 67 5b 69 42 65 66 6f  .  p->aArg[iBefo
2840: 72 65 5d 20 3d 20 61 72 67 3b 0a 20 20 72 65 74  re] = arg;.  ret
2850: 75 72 6e 20 69 42 65 66 6f 72 65 3b 0a 7d 0a 0a  urn iBefore;.}..
2860: 2f 2a 20 41 70 70 65 6e 64 20 61 20 6e 65 77 20  /* Append a new 
2870: 6f 70 63 6f 64 65 20 61 6e 64 20 61 72 67 75 6d  opcode and argum
2880: 65 6e 74 20 74 6f 20 74 68 65 20 65 6e 64 20 6f  ent to the end o
2890: 66 20 74 68 65 20 52 45 20 75 6e 64 65 72 20 63  f the RE under c
28a0: 6f 6e 73 74 72 75 63 74 69 6f 6e 2e 0a 2a 2f 0a  onstruction..*/.
28b0: 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f 61 70  static int re_ap
28c0: 70 65 6e 64 28 52 65 43 6f 6d 70 69 6c 65 64 20  pend(ReCompiled 
28d0: 2a 70 2c 20 69 6e 74 20 6f 70 2c 20 69 6e 74 20  *p, int op, int 
28e0: 61 72 67 29 7b 0a 20 20 72 65 74 75 72 6e 20 72  arg){.  return r
28f0: 65 5f 69 6e 73 65 72 74 28 70 2c 20 70 2d 3e 6e  e_insert(p, p->n
2900: 53 74 61 74 65 2c 20 6f 70 2c 20 61 72 67 29 3b  State, op, arg);
2910: 0a 7d 0a 0a 2f 2a 20 4d 61 6b 65 20 61 20 63 6f  .}../* Make a co
2920: 70 79 20 6f 66 20 4e 20 6f 70 63 6f 64 65 73 20  py of N opcodes 
2930: 73 74 61 72 74 69 6e 67 20 61 74 20 69 53 74 61  starting at iSta
2940: 72 74 20 6f 6e 74 6f 20 74 68 65 20 65 6e 64 20  rt onto the end 
2950: 6f 66 20 74 68 65 20 52 45 0a 2a 2a 20 75 6e 64  of the RE.** und
2960: 65 72 20 63 6f 6e 73 74 72 75 63 74 69 6f 6e 2e  er construction.
2970: 0a 2a 2f 0a 73 74 61 74 69 63 20 76 6f 69 64 20  .*/.static void 
2980: 72 65 5f 63 6f 70 79 28 52 65 43 6f 6d 70 69 6c  re_copy(ReCompil
2990: 65 64 20 2a 70 2c 20 69 6e 74 20 69 53 74 61 72  ed *p, int iStar
29a0: 74 2c 20 69 6e 74 20 4e 29 7b 0a 20 20 69 66 28  t, int N){.  if(
29b0: 20 70 2d 3e 6e 53 74 61 74 65 2b 4e 3e 3d 70 2d   p->nState+N>=p-
29c0: 3e 6e 41 6c 6c 6f 63 20 26 26 20 72 65 5f 72 65  >nAlloc && re_re
29d0: 73 69 7a 65 28 70 2c 20 70 2d 3e 6e 41 6c 6c 6f  size(p, p->nAllo
29e0: 63 2a 32 2b 4e 29 20 29 20 72 65 74 75 72 6e 3b  c*2+N) ) return;
29f0: 0a 20 20 6d 65 6d 63 70 79 28 26 70 2d 3e 61 4f  .  memcpy(&p->aO
2a00: 70 5b 70 2d 3e 6e 53 74 61 74 65 5d 2c 20 26 70  p[p->nState], &p
2a10: 2d 3e 61 4f 70 5b 69 53 74 61 72 74 5d 2c 20 4e  ->aOp[iStart], N
2a20: 2a 73 69 7a 65 6f 66 28 70 2d 3e 61 4f 70 5b 30  *sizeof(p->aOp[0
2a30: 5d 29 29 3b 0a 20 20 6d 65 6d 63 70 79 28 26 70  ]));.  memcpy(&p
2a40: 2d 3e 61 41 72 67 5b 70 2d 3e 6e 53 74 61 74 65  ->aArg[p->nState
2a50: 5d 2c 20 26 70 2d 3e 61 41 72 67 5b 69 53 74 61  ], &p->aArg[iSta
2a60: 72 74 5d 2c 20 4e 2a 73 69 7a 65 6f 66 28 70 2d  rt], N*sizeof(p-
2a70: 3e 61 41 72 67 5b 30 5d 29 29 3b 0a 20 20 70 2d  >aArg[0]));.  p-
2a80: 3e 6e 53 74 61 74 65 20 2b 3d 20 4e 3b 0a 7d 0a  >nState += N;.}.
2a90: 0a 2f 2a 20 52 65 74 75 72 6e 20 74 72 75 65 20  ./* Return true 
2aa0: 69 66 20 63 20 69 73 20 61 20 68 65 78 61 64 65  if c is a hexade
2ab0: 63 69 6d 61 6c 20 64 69 67 69 74 20 63 68 61 72  cimal digit char
2ac0: 61 63 74 65 72 3a 20 20 5b 30 2d 39 61 2d 66 41  acter:  [0-9a-fA
2ad0: 2d 46 5d 0a 2a 2a 20 49 66 20 63 20 69 73 20 61  -F].** If c is a
2ae0: 20 68 65 78 20 64 69 67 69 74 2c 20 61 6c 73 6f   hex digit, also
2af0: 20 73 65 74 20 2a 70 56 20 3d 20 28 2a 70 56 29   set *pV = (*pV)
2b00: 2a 31 36 20 2b 20 76 61 6c 75 65 6f 66 28 63 29  *16 + valueof(c)
2b10: 2e 20 20 49 66 0a 2a 2a 20 63 20 69 73 20 6e 6f  .  If.** c is no
2b20: 74 20 61 20 68 65 78 20 64 69 67 69 74 20 2a 70  t a hex digit *p
2b30: 56 20 69 73 20 75 6e 63 68 61 6e 67 65 64 2e 0a  V is unchanged..
2b40: 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74 20 72 65  */.static int re
2b50: 5f 68 65 78 28 69 6e 74 20 63 2c 20 69 6e 74 20  _hex(int c, int 
2b60: 2a 70 56 29 7b 0a 20 20 69 66 28 20 63 3e 3d 27  *pV){.  if( c>='
2b70: 30 27 20 26 26 20 63 3c 3d 27 39 27 20 29 7b 0a  0' && c<='9' ){.
2b80: 20 20 20 20 63 20 2d 3d 20 27 30 27 3b 0a 20 20      c -= '0';.  
2b90: 7d 65 6c 73 65 20 69 66 28 20 63 3e 3d 27 61 27  }else if( c>='a'
2ba0: 20 26 26 20 63 3c 3d 27 66 27 20 29 7b 0a 20 20   && c<='f' ){.  
2bb0: 20 20 63 20 2d 3d 20 27 61 27 20 2d 20 31 30 3b    c -= 'a' - 10;
2bc0: 0a 20 20 7d 65 6c 73 65 20 69 66 28 20 63 3e 3d  .  }else if( c>=
2bd0: 27 41 27 20 26 26 20 63 3c 3d 27 46 27 20 29 7b  'A' && c<='F' ){
2be0: 0a 20 20 20 20 63 20 2d 3d 20 27 41 27 20 2d 20  .    c -= 'A' - 
2bf0: 31 30 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20 20 20  10;.  }else{.   
2c00: 20 72 65 74 75 72 6e 20 30 3b 0a 20 20 7d 0a 20   return 0;.  }. 
2c10: 20 2a 70 56 20 3d 20 28 2a 70 56 29 2a 31 36 20   *pV = (*pV)*16 
2c20: 2b 20 28 63 20 26 20 30 78 66 66 29 3b 0a 20 20  + (c & 0xff);.  
2c30: 72 65 74 75 72 6e 20 31 3b 0a 7d 0a 0a 2f 2a 20  return 1;.}../* 
2c40: 41 20 62 61 63 6b 73 6c 61 73 68 20 63 68 61 72  A backslash char
2c50: 61 63 74 65 72 20 68 61 73 20 62 65 65 6e 20 73  acter has been s
2c60: 65 65 6e 2c 20 72 65 61 64 20 74 68 65 20 6e 65  een, read the ne
2c70: 78 74 20 63 68 61 72 61 63 74 65 72 20 61 6e 64  xt character and
2c80: 0a 2a 2a 20 72 65 74 75 72 6e 20 69 74 73 20 69  .** return its i
2c90: 6e 74 65 72 70 72 65 74 61 74 69 6f 6e 2e 0a 2a  nterpretation..*
2ca0: 2f 0a 73 74 61 74 69 63 20 75 6e 73 69 67 6e 65  /.static unsigne
2cb0: 64 20 72 65 5f 65 73 63 5f 63 68 61 72 28 52 65  d re_esc_char(Re
2cc0: 43 6f 6d 70 69 6c 65 64 20 2a 70 29 7b 0a 20 20  Compiled *p){.  
2cd0: 73 74 61 74 69 63 20 63 6f 6e 73 74 20 63 68 61  static const cha
2ce0: 72 20 7a 45 73 63 5b 5d 20 3d 20 22 61 66 6e 72  r zEsc[] = "afnr
2cf0: 74 76 5c 5c 28 29 2a 2e 2b 3f 5b 24 5e 7b 7c 7d  tv\\()*.+?[$^{|}
2d00: 5d 22 3b 0a 20 20 73 74 61 74 69 63 20 63 6f 6e  ]";.  static con
2d10: 73 74 20 63 68 61 72 20 7a 54 72 61 6e 73 5b 5d  st char zTrans[]
2d20: 20 3d 20 22 5c 61 5c 66 5c 6e 5c 72 5c 74 5c 76   = "\a\f\n\r\t\v
2d30: 22 3b 0a 20 20 69 6e 74 20 69 2c 20 76 20 3d 20  ";.  int i, v = 
2d40: 30 3b 0a 20 20 63 68 61 72 20 63 3b 0a 20 20 69  0;.  char c;.  i
2d50: 66 28 20 70 2d 3e 73 49 6e 2e 69 3e 3d 70 2d 3e  f( p->sIn.i>=p->
2d60: 73 49 6e 2e 6d 78 20 29 20 72 65 74 75 72 6e 20  sIn.mx ) return 
2d70: 30 3b 0a 20 20 63 20 3d 20 70 2d 3e 73 49 6e 2e  0;.  c = p->sIn.
2d80: 7a 5b 70 2d 3e 73 49 6e 2e 69 5d 3b 0a 20 20 69  z[p->sIn.i];.  i
2d90: 66 28 20 63 3d 3d 27 75 27 20 26 26 20 70 2d 3e  f( c=='u' && p->
2da0: 73 49 6e 2e 69 2b 34 3c 70 2d 3e 73 49 6e 2e 6d  sIn.i+4<p->sIn.m
2db0: 78 20 29 7b 0a 20 20 20 20 63 6f 6e 73 74 20 75  x ){.    const u
2dc0: 6e 73 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 49  nsigned char *zI
2dd0: 6e 20 3d 20 70 2d 3e 73 49 6e 2e 7a 20 2b 20 70  n = p->sIn.z + p
2de0: 2d 3e 73 49 6e 2e 69 3b 0a 20 20 20 20 69 66 28  ->sIn.i;.    if(
2df0: 20 72 65 5f 68 65 78 28 7a 49 6e 5b 31 5d 2c 26   re_hex(zIn[1],&
2e00: 76 29 0a 20 20 20 20 20 26 26 20 72 65 5f 68 65  v).     && re_he
2e10: 78 28 7a 49 6e 5b 32 5d 2c 26 76 29 0a 20 20 20  x(zIn[2],&v).   
2e20: 20 20 26 26 20 72 65 5f 68 65 78 28 7a 49 6e 5b    && re_hex(zIn[
2e30: 33 5d 2c 26 76 29 0a 20 20 20 20 20 26 26 20 72  3],&v).     && r
2e40: 65 5f 68 65 78 28 7a 49 6e 5b 34 5d 2c 26 76 29  e_hex(zIn[4],&v)
2e50: 0a 20 20 20 20 29 7b 0a 20 20 20 20 20 20 70 2d  .    ){.      p-
2e60: 3e 73 49 6e 2e 69 20 2b 3d 20 35 3b 0a 20 20 20  >sIn.i += 5;.   
2e70: 20 20 20 72 65 74 75 72 6e 20 76 3b 0a 20 20 20     return v;.   
2e80: 20 7d 0a 20 20 7d 0a 20 20 69 66 28 20 63 3d 3d   }.  }.  if( c==
2e90: 27 78 27 20 26 26 20 70 2d 3e 73 49 6e 2e 69 2b  'x' && p->sIn.i+
2ea0: 32 3c 70 2d 3e 73 49 6e 2e 6d 78 20 29 7b 0a 20  2<p->sIn.mx ){. 
2eb0: 20 20 20 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65     const unsigne
2ec0: 64 20 63 68 61 72 20 2a 7a 49 6e 20 3d 20 70 2d  d char *zIn = p-
2ed0: 3e 73 49 6e 2e 7a 20 2b 20 70 2d 3e 73 49 6e 2e  >sIn.z + p->sIn.
2ee0: 69 3b 0a 20 20 20 20 69 66 28 20 72 65 5f 68 65  i;.    if( re_he
2ef0: 78 28 7a 49 6e 5b 31 5d 2c 26 76 29 0a 20 20 20  x(zIn[1],&v).   
2f00: 20 20 26 26 20 72 65 5f 68 65 78 28 7a 49 6e 5b    && re_hex(zIn[
2f10: 32 5d 2c 26 76 29 0a 20 20 20 20 29 7b 0a 20 20  2],&v).    ){.  
2f20: 20 20 20 20 70 2d 3e 73 49 6e 2e 69 20 2b 3d 20      p->sIn.i += 
2f30: 33 3b 0a 20 20 20 20 20 20 72 65 74 75 72 6e 20  3;.      return 
2f40: 76 3b 0a 20 20 20 20 7d 0a 20 20 7d 0a 20 20 66  v;.    }.  }.  f
2f50: 6f 72 28 69 3d 30 3b 20 7a 45 73 63 5b 69 5d 20  or(i=0; zEsc[i] 
2f60: 26 26 20 7a 45 73 63 5b 69 5d 21 3d 63 3b 20 69  && zEsc[i]!=c; i
2f70: 2b 2b 29 7b 7d 0a 20 20 69 66 28 20 7a 45 73 63  ++){}.  if( zEsc
2f80: 5b 69 5d 20 29 7b 0a 20 20 20 20 69 66 28 20 69  [i] ){.    if( i
2f90: 3c 36 20 29 20 63 20 3d 20 7a 54 72 61 6e 73 5b  <6 ) c = zTrans[
2fa0: 69 5d 3b 0a 20 20 20 20 70 2d 3e 73 49 6e 2e 69  i];.    p->sIn.i
2fb0: 2b 2b 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20 20 20  ++;.  }else{.   
2fc0: 20 70 2d 3e 7a 45 72 72 20 3d 20 22 75 6e 6b 6e   p->zErr = "unkn
2fd0: 6f 77 6e 20 5c 5c 20 65 73 63 61 70 65 22 3b 0a  own \\ escape";.
2fe0: 20 20 7d 0a 20 20 72 65 74 75 72 6e 20 63 3b 0a    }.  return c;.
2ff0: 7d 0a 0a 2f 2a 20 46 6f 72 77 61 72 64 20 64 65  }../* Forward de
3000: 63 6c 61 72 61 74 69 6f 6e 20 2a 2f 0a 73 74 61  claration */.sta
3010: 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20 2a  tic const char *
3020: 72 65 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 73 74  re_subcompile_st
3030: 72 69 6e 67 28 52 65 43 6f 6d 70 69 6c 65 64 2a  ring(ReCompiled*
3040: 29 3b 0a 0a 2f 2a 20 50 65 65 6b 20 61 74 20 74  );../* Peek at t
3050: 68 65 20 6e 65 78 74 20 62 79 74 65 20 6f 66 20  he next byte of 
3060: 69 6e 70 75 74 20 2a 2f 0a 73 74 61 74 69 63 20  input */.static 
3070: 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20 72 65  unsigned char re
3080: 50 65 65 6b 28 52 65 43 6f 6d 70 69 6c 65 64 20  Peek(ReCompiled 
3090: 2a 70 29 7b 0a 20 20 72 65 74 75 72 6e 20 70 2d  *p){.  return p-
30a0: 3e 73 49 6e 2e 69 3c 70 2d 3e 73 49 6e 2e 6d 78  >sIn.i<p->sIn.mx
30b0: 20 3f 20 70 2d 3e 73 49 6e 2e 7a 5b 70 2d 3e 73   ? p->sIn.z[p->s
30c0: 49 6e 2e 69 5d 20 3a 20 30 3b 0a 7d 0a 0a 2f 2a  In.i] : 0;.}../*
30d0: 20 43 6f 6d 70 69 6c 65 20 52 45 20 74 65 78 74   Compile RE text
30e0: 20 69 6e 74 6f 20 61 20 73 65 71 75 65 6e 63 65   into a sequence
30f0: 20 6f 66 20 6f 70 63 6f 64 65 73 2e 20 20 43 6f   of opcodes.  Co
3100: 6e 74 69 6e 75 65 20 75 70 20 74 6f 20 74 68 65  ntinue up to the
3110: 0a 2a 2a 20 66 69 72 73 74 20 75 6e 6d 61 74 63  .** first unmatc
3120: 68 65 64 20 22 29 22 20 63 68 61 72 61 63 74 65  hed ")" characte
3130: 72 2c 20 74 68 65 6e 20 72 65 74 75 72 6e 2e 20  r, then return. 
3140: 20 49 66 20 61 6e 20 65 72 72 6f 72 20 69 73 20   If an error is 
3150: 66 6f 75 6e 64 2c 0a 2a 2a 20 72 65 74 75 72 6e  found,.** return
3160: 20 61 20 70 6f 69 6e 74 65 72 20 74 6f 20 74 68   a pointer to th
3170: 65 20 65 72 72 6f 72 20 6d 65 73 73 61 67 65 20  e error message 
3180: 73 74 72 69 6e 67 2e 0a 2a 2f 0a 73 74 61 74 69  string..*/.stati
3190: 63 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 72 65  c const char *re
31a0: 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 72 65 28 52  _subcompile_re(R
31b0: 65 43 6f 6d 70 69 6c 65 64 20 2a 70 29 7b 0a 20  eCompiled *p){. 
31c0: 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a 45 72   const char *zEr
31d0: 72 3b 0a 20 20 69 6e 74 20 69 53 74 61 72 74 2c  r;.  int iStart,
31e0: 20 69 45 6e 64 2c 20 69 47 6f 74 6f 3b 0a 20 20   iEnd, iGoto;.  
31f0: 69 53 74 61 72 74 20 3d 20 70 2d 3e 6e 53 74 61  iStart = p->nSta
3200: 74 65 3b 0a 20 20 7a 45 72 72 20 3d 20 72 65 5f  te;.  zErr = re_
3210: 73 75 62 63 6f 6d 70 69 6c 65 5f 73 74 72 69 6e  subcompile_strin
3220: 67 28 70 29 3b 0a 20 20 69 66 28 20 7a 45 72 72  g(p);.  if( zErr
3230: 20 29 20 72 65 74 75 72 6e 20 7a 45 72 72 3b 0a   ) return zErr;.
3240: 20 20 77 68 69 6c 65 28 20 72 65 50 65 65 6b 28    while( rePeek(
3250: 70 29 3d 3d 27 7c 27 20 29 7b 0a 20 20 20 20 69  p)=='|' ){.    i
3260: 45 6e 64 20 3d 20 70 2d 3e 6e 53 74 61 74 65 3b  End = p->nState;
3270: 0a 20 20 20 20 72 65 5f 69 6e 73 65 72 74 28 70  .    re_insert(p
3280: 2c 20 69 53 74 61 72 74 2c 20 52 45 5f 4f 50 5f  , iStart, RE_OP_
3290: 46 4f 52 4b 2c 20 69 45 6e 64 20 2b 20 32 20 2d  FORK, iEnd + 2 -
32a0: 20 69 53 74 61 72 74 29 3b 0a 20 20 20 20 69 47   iStart);.    iG
32b0: 6f 74 6f 20 3d 20 72 65 5f 61 70 70 65 6e 64 28  oto = re_append(
32c0: 70 2c 20 52 45 5f 4f 50 5f 47 4f 54 4f 2c 20 30  p, RE_OP_GOTO, 0
32d0: 29 3b 0a 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b  );.    p->sIn.i+
32e0: 2b 3b 0a 20 20 20 20 7a 45 72 72 20 3d 20 72 65  +;.    zErr = re
32f0: 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 73 74 72 69  _subcompile_stri
3300: 6e 67 28 70 29 3b 0a 20 20 20 20 69 66 28 20 7a  ng(p);.    if( z
3310: 45 72 72 20 29 20 72 65 74 75 72 6e 20 7a 45 72  Err ) return zEr
3320: 72 3b 0a 20 20 20 20 70 2d 3e 61 41 72 67 5b 69  r;.    p->aArg[i
3330: 47 6f 74 6f 5d 20 3d 20 70 2d 3e 6e 53 74 61 74  Goto] = p->nStat
3340: 65 20 2d 20 69 47 6f 74 6f 3b 0a 20 20 7d 0a 20  e - iGoto;.  }. 
3350: 20 72 65 74 75 72 6e 20 30 3b 0a 7d 0a 0a 2f 2a   return 0;.}../*
3360: 20 43 6f 6d 70 69 6c 65 20 61 6e 20 65 6c 65 6d   Compile an elem
3370: 65 6e 74 20 6f 66 20 72 65 67 75 6c 61 72 20 65  ent of regular e
3380: 78 70 72 65 73 73 69 6f 6e 20 74 65 78 74 20 28  xpression text (
3390: 61 6e 79 74 68 69 6e 67 20 74 68 61 74 20 63 61  anything that ca
33a0: 6e 20 62 65 0a 2a 2a 20 61 6e 20 6f 70 65 72 61  n be.** an opera
33b0: 6e 64 20 74 6f 20 74 68 65 20 22 7c 22 20 6f 70  nd to the "|" op
33c0: 65 72 61 74 6f 72 29 2e 20 20 52 65 74 75 72 6e  erator).  Return
33d0: 20 4e 55 4c 4c 20 6f 6e 20 73 75 63 63 65 73 73   NULL on success
33e0: 20 6f 72 20 61 20 70 6f 69 6e 74 65 72 0a 2a 2a   or a pointer.**
33f0: 20 74 6f 20 74 68 65 20 65 72 72 6f 72 20 6d 65   to the error me
3400: 73 73 61 67 65 20 69 66 20 74 68 65 72 65 20 69  ssage if there i
3410: 73 20 61 20 70 72 6f 62 6c 65 6d 2e 0a 2a 2f 0a  s a problem..*/.
3420: 73 74 61 74 69 63 20 63 6f 6e 73 74 20 63 68 61  static const cha
3430: 72 20 2a 72 65 5f 73 75 62 63 6f 6d 70 69 6c 65  r *re_subcompile
3440: 5f 73 74 72 69 6e 67 28 52 65 43 6f 6d 70 69 6c  _string(ReCompil
3450: 65 64 20 2a 70 29 7b 0a 20 20 69 6e 74 20 69 50  ed *p){.  int iP
3460: 72 65 76 20 3d 20 2d 31 3b 0a 20 20 69 6e 74 20  rev = -1;.  int 
3470: 69 53 74 61 72 74 3b 0a 20 20 75 6e 73 69 67 6e  iStart;.  unsign
3480: 65 64 20 63 3b 0a 20 20 63 6f 6e 73 74 20 63 68  ed c;.  const ch
3490: 61 72 20 2a 7a 45 72 72 3b 0a 20 20 77 68 69 6c  ar *zErr;.  whil
34a0: 65 28 20 28 63 20 3d 20 70 2d 3e 78 4e 65 78 74  e( (c = p->xNext
34b0: 43 68 61 72 28 26 70 2d 3e 73 49 6e 29 29 21 3d  Char(&p->sIn))!=
34c0: 30 20 29 7b 0a 20 20 20 20 69 53 74 61 72 74 20  0 ){.    iStart 
34d0: 3d 20 70 2d 3e 6e 53 74 61 74 65 3b 0a 20 20 20  = p->nState;.   
34e0: 20 73 77 69 74 63 68 28 20 63 20 29 7b 0a 20 20   switch( c ){.  
34f0: 20 20 20 20 63 61 73 65 20 27 7c 27 3a 0a 20 20      case '|':.  
3500: 20 20 20 20 63 61 73 65 20 27 24 27 3a 0a 20 20      case '$':.  
3510: 20 20 20 20 63 61 73 65 20 27 29 27 3a 20 7b 0a      case ')': {.
3520: 20 20 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69          p->sIn.i
3530: 2d 2d 3b 0a 20 20 20 20 20 20 20 20 72 65 74 75  --;.        retu
3540: 72 6e 20 30 3b 0a 20 20 20 20 20 20 7d 0a 20 20  rn 0;.      }.  
3550: 20 20 20 20 63 61 73 65 20 27 28 27 3a 20 7b 0a      case '(': {.
3560: 20 20 20 20 20 20 20 20 7a 45 72 72 20 3d 20 72          zErr = r
3570: 65 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 72 65 28  e_subcompile_re(
3580: 70 29 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20  p);.        if( 
3590: 7a 45 72 72 20 29 20 72 65 74 75 72 6e 20 7a 45  zErr ) return zE
35a0: 72 72 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20  rr;.        if( 
35b0: 72 65 50 65 65 6b 28 70 29 21 3d 27 29 27 20 29  rePeek(p)!=')' )
35c0: 20 72 65 74 75 72 6e 20 22 75 6e 6d 61 74 63 68   return "unmatch
35d0: 65 64 20 27 28 27 22 3b 0a 20 20 20 20 20 20 20  ed '('";.       
35e0: 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20   p->sIn.i++;.   
35f0: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
3600: 20 20 7d 0a 20 20 20 20 20 20 63 61 73 65 20 27    }.      case '
3610: 2e 27 3a 20 7b 0a 20 20 20 20 20 20 20 20 69 66  .': {.        if
3620: 28 20 72 65 50 65 65 6b 28 70 29 3d 3d 27 2a 27  ( rePeek(p)=='*'
3630: 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20 72 65   ){.          re
3640: 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50  _append(p, RE_OP
3650: 5f 41 4e 59 53 54 41 52 2c 20 30 29 3b 0a 20 20  _ANYSTAR, 0);.  
3660: 20 20 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69          p->sIn.i
3670: 2b 2b 3b 0a 20 20 20 20 20 20 20 20 7d 65 6c 73  ++;.        }els
3680: 65 7b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f  e{.          re_
3690: 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f  append(p, RE_OP_
36a0: 41 4e 59 2c 20 30 29 3b 0a 20 20 20 20 20 20 20  ANY, 0);.       
36b0: 20 7d 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b   }.        break
36c0: 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20  ;.      }.      
36d0: 63 61 73 65 20 27 2a 27 3a 20 7b 0a 20 20 20 20  case '*': {.    
36e0: 20 20 20 20 69 66 28 20 69 50 72 65 76 3c 30 20      if( iPrev<0 
36f0: 29 20 72 65 74 75 72 6e 20 22 27 2a 27 20 77 69  ) return "'*' wi
3700: 74 68 6f 75 74 20 6f 70 65 72 61 6e 64 22 3b 0a  thout operand";.
3710: 20 20 20 20 20 20 20 20 72 65 5f 69 6e 73 65 72          re_inser
3720: 74 28 70 2c 20 69 50 72 65 76 2c 20 52 45 5f 4f  t(p, iPrev, RE_O
3730: 50 5f 47 4f 54 4f 2c 20 70 2d 3e 6e 53 74 61 74  P_GOTO, p->nStat
3740: 65 20 2d 20 69 50 72 65 76 20 2b 20 31 29 3b 0a  e - iPrev + 1);.
3750: 20 20 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e          re_appen
3760: 64 28 70 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c  d(p, RE_OP_FORK,
3770: 20 69 50 72 65 76 20 2d 20 70 2d 3e 6e 53 74 61   iPrev - p->nSta
3780: 74 65 20 2b 20 31 29 3b 0a 20 20 20 20 20 20 20  te + 1);.       
3790: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a   break;.      }.
37a0: 20 20 20 20 20 20 63 61 73 65 20 27 2b 27 3a 20        case '+': 
37b0: 7b 0a 20 20 20 20 20 20 20 20 69 66 28 20 69 50  {.        if( iP
37c0: 72 65 76 3c 30 20 29 20 72 65 74 75 72 6e 20 22  rev<0 ) return "
37d0: 27 2b 27 20 77 69 74 68 6f 75 74 20 6f 70 65 72  '+' without oper
37e0: 61 6e 64 22 3b 0a 20 20 20 20 20 20 20 20 72 65  and";.        re
37f0: 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50  _append(p, RE_OP
3800: 5f 46 4f 52 4b 2c 20 69 50 72 65 76 20 2d 20 70  _FORK, iPrev - p
3810: 2d 3e 6e 53 74 61 74 65 29 3b 0a 20 20 20 20 20  ->nState);.     
3820: 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20     break;.      
3830: 7d 0a 20 20 20 20 20 20 63 61 73 65 20 27 3f 27  }.      case '?'
3840: 3a 20 7b 0a 20 20 20 20 20 20 20 20 69 66 28 20  : {.        if( 
3850: 69 50 72 65 76 3c 30 20 29 20 72 65 74 75 72 6e  iPrev<0 ) return
3860: 20 22 27 3f 27 20 77 69 74 68 6f 75 74 20 6f 70   "'?' without op
3870: 65 72 61 6e 64 22 3b 0a 20 20 20 20 20 20 20 20  erand";.        
3880: 72 65 5f 69 6e 73 65 72 74 28 70 2c 20 69 50 72  re_insert(p, iPr
3890: 65 76 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c 20  ev, RE_OP_FORK, 
38a0: 70 2d 3e 6e 53 74 61 74 65 20 2d 20 69 50 72 65  p->nState - iPre
38b0: 76 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 62 72  v+1);.        br
38c0: 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20  eak;.      }.   
38d0: 20 20 20 63 61 73 65 20 27 7b 27 3a 20 7b 0a 20     case '{': {. 
38e0: 20 20 20 20 20 20 20 69 6e 74 20 6d 20 3d 20 30         int m = 0
38f0: 2c 20 6e 20 3d 20 30 3b 0a 20 20 20 20 20 20 20  , n = 0;.       
3900: 20 69 6e 74 20 73 7a 2c 20 6a 3b 0a 20 20 20 20   int sz, j;.    
3910: 20 20 20 20 69 66 28 20 69 50 72 65 76 3c 30 20      if( iPrev<0 
3920: 29 20 72 65 74 75 72 6e 20 22 27 7b 6d 2c 6e 7d  ) return "'{m,n}
3930: 27 20 77 69 74 68 6f 75 74 20 6f 70 65 72 61 6e  ' without operan
3940: 64 22 3b 0a 20 20 20 20 20 20 20 20 77 68 69 6c  d";.        whil
3950: 65 28 20 28 63 3d 72 65 50 65 65 6b 28 70 29 29  e( (c=rePeek(p))
3960: 3e 3d 27 30 27 20 26 26 20 63 3c 3d 27 39 27 20  >='0' && c<='9' 
3970: 29 7b 20 6d 20 3d 20 6d 2a 31 30 20 2b 20 63 20  ){ m = m*10 + c 
3980: 2d 20 27 30 27 3b 20 70 2d 3e 73 49 6e 2e 69 2b  - '0'; p->sIn.i+
3990: 2b 3b 20 7d 0a 20 20 20 20 20 20 20 20 6e 20 3d  +; }.        n =
39a0: 20 6d 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20   m;.        if( 
39b0: 63 3d 3d 27 2c 27 20 29 7b 0a 20 20 20 20 20 20  c==',' ){.      
39c0: 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a      p->sIn.i++;.
39d0: 20 20 20 20 20 20 20 20 20 20 6e 20 3d 20 30 3b            n = 0;
39e0: 0a 20 20 20 20 20 20 20 20 20 20 77 68 69 6c 65  .          while
39f0: 28 20 28 63 3d 72 65 50 65 65 6b 28 70 29 29 3e  ( (c=rePeek(p))>
3a00: 3d 27 30 27 20 26 26 20 63 3c 3d 27 39 27 20 29  ='0' && c<='9' )
3a10: 7b 20 6e 20 3d 20 6e 2a 31 30 20 2b 20 63 2d 27  { n = n*10 + c-'
3a20: 30 27 3b 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 20  0'; p->sIn.i++; 
3a30: 7d 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20  }.        }.    
3a40: 20 20 20 20 69 66 28 20 63 21 3d 27 7d 27 20 29      if( c!='}' )
3a50: 20 72 65 74 75 72 6e 20 22 75 6e 6d 61 74 63 68   return "unmatch
3a60: 65 64 20 27 7b 27 22 3b 0a 20 20 20 20 20 20 20  ed '{'";.       
3a70: 20 69 66 28 20 6e 3e 30 20 26 26 20 6e 3c 6d 20   if( n>0 && n<m 
3a80: 29 20 72 65 74 75 72 6e 20 22 6e 20 6c 65 73 73  ) return "n less
3a90: 20 74 68 61 6e 20 6d 20 69 6e 20 27 7b 6d 2c 6e   than m in '{m,n
3aa0: 7d 27 22 3b 0a 20 20 20 20 20 20 20 20 70 2d 3e  }'";.        p->
3ab0: 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20 20 20 20 20  sIn.i++;.       
3ac0: 20 73 7a 20 3d 20 70 2d 3e 6e 53 74 61 74 65 20   sz = p->nState 
3ad0: 2d 20 69 50 72 65 76 3b 0a 20 20 20 20 20 20 20  - iPrev;.       
3ae0: 20 69 66 28 20 6d 3d 3d 30 20 29 7b 0a 20 20 20   if( m==0 ){.   
3af0: 20 20 20 20 20 20 20 69 66 28 20 6e 3d 3d 30 20         if( n==0 
3b00: 29 20 72 65 74 75 72 6e 20 22 62 6f 74 68 20 6d  ) return "both m
3b10: 20 61 6e 64 20 6e 20 61 72 65 20 7a 65 72 6f 20   and n are zero 
3b20: 69 6e 20 27 7b 6d 2c 6e 7d 27 22 3b 0a 20 20 20  in '{m,n}'";.   
3b30: 20 20 20 20 20 20 20 72 65 5f 69 6e 73 65 72 74         re_insert
3b40: 28 70 2c 20 69 50 72 65 76 2c 20 52 45 5f 4f 50  (p, iPrev, RE_OP
3b50: 5f 46 4f 52 4b 2c 20 73 7a 2b 31 29 3b 0a 20 20  _FORK, sz+1);.  
3b60: 20 20 20 20 20 20 20 20 6e 2d 2d 3b 0a 20 20 20          n--;.   
3b70: 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20       }else{.    
3b80: 20 20 20 20 20 20 66 6f 72 28 6a 3d 31 3b 20 6a        for(j=1; j
3b90: 3c 6d 3b 20 6a 2b 2b 29 20 72 65 5f 63 6f 70 79  <m; j++) re_copy
3ba0: 28 70 2c 20 69 50 72 65 76 2c 20 73 7a 29 3b 0a  (p, iPrev, sz);.
3bb0: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
3bc0: 20 20 66 6f 72 28 6a 3d 6d 3b 20 6a 3c 6e 3b 20    for(j=m; j<n; 
3bd0: 6a 2b 2b 29 7b 0a 20 20 20 20 20 20 20 20 20 20  j++){.          
3be0: 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f  re_append(p, RE_
3bf0: 4f 50 5f 46 4f 52 4b 2c 20 73 7a 2b 31 29 3b 0a  OP_FORK, sz+1);.
3c00: 20 20 20 20 20 20 20 20 20 20 72 65 5f 63 6f 70            re_cop
3c10: 79 28 70 2c 20 69 50 72 65 76 2c 20 73 7a 29 3b  y(p, iPrev, sz);
3c20: 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20  .        }.     
3c30: 20 20 20 69 66 28 20 6e 3d 3d 30 20 26 26 20 6d     if( n==0 && m
3c40: 3e 30 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20  >0 ){.          
3c50: 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f  re_append(p, RE_
3c60: 4f 50 5f 46 4f 52 4b 2c 20 2d 73 7a 29 3b 0a 20  OP_FORK, -sz);. 
3c70: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20         }.       
3c80: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a   break;.      }.
3c90: 20 20 20 20 20 20 63 61 73 65 20 27 5b 27 3a 20        case '[': 
3ca0: 7b 0a 20 20 20 20 20 20 20 20 69 6e 74 20 69 46  {.        int iF
3cb0: 69 72 73 74 20 3d 20 70 2d 3e 6e 53 74 61 74 65  irst = p->nState
3cc0: 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 72 65  ;.        if( re
3cd0: 50 65 65 6b 28 70 29 3d 3d 27 5e 27 20 29 7b 0a  Peek(p)=='^' ){.
3ce0: 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 70 70            re_app
3cf0: 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 43 43 5f  end(p, RE_OP_CC_
3d00: 45 58 43 2c 20 30 29 3b 0a 20 20 20 20 20 20 20  EXC, 0);.       
3d10: 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20     p->sIn.i++;. 
3d20: 20 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20         }else{.  
3d30: 20 20 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e          re_appen
3d40: 64 28 70 2c 20 52 45 5f 4f 50 5f 43 43 5f 49 4e  d(p, RE_OP_CC_IN
3d50: 43 2c 20 30 29 3b 0a 20 20 20 20 20 20 20 20 7d  C, 0);.        }
3d60: 0a 20 20 20 20 20 20 20 20 77 68 69 6c 65 28 20  .        while( 
3d70: 28 63 20 3d 20 70 2d 3e 78 4e 65 78 74 43 68 61  (c = p->xNextCha
3d80: 72 28 26 70 2d 3e 73 49 6e 29 29 21 3d 30 20 29  r(&p->sIn))!=0 )
3d90: 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20  {.          if( 
3da0: 63 3d 3d 27 5b 27 20 26 26 20 72 65 50 65 65 6b  c=='[' && rePeek
3db0: 28 70 29 3d 3d 27 3a 27 20 29 7b 0a 20 20 20 20  (p)==':' ){.    
3dc0: 20 20 20 20 20 20 20 20 72 65 74 75 72 6e 20 22          return "
3dd0: 50 4f 53 49 58 20 63 68 61 72 61 63 74 65 72 20  POSIX character 
3de0: 63 6c 61 73 73 65 73 20 6e 6f 74 20 73 75 70 70  classes not supp
3df0: 6f 72 74 65 64 22 3b 0a 20 20 20 20 20 20 20 20  orted";.        
3e00: 20 20 7d 0a 20 20 20 20 20 20 20 20 20 20 69 66    }.          if
3e10: 28 20 63 3d 3d 27 5c 5c 27 20 29 20 63 20 3d 20  ( c=='\\' ) c = 
3e20: 72 65 5f 65 73 63 5f 63 68 61 72 28 70 29 3b 0a  re_esc_char(p);.
3e30: 20 20 20 20 20 20 20 20 20 20 69 66 28 20 72 65            if( re
3e40: 50 65 65 6b 28 70 29 3d 3d 27 2d 27 20 29 7b 0a  Peek(p)=='-' ){.
3e50: 20 20 20 20 20 20 20 20 20 20 20 20 72 65 5f 61              re_a
3e60: 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 43  ppend(p, RE_OP_C
3e70: 43 5f 52 41 4e 47 45 2c 20 63 29 3b 0a 20 20 20  C_RANGE, c);.   
3e80: 20 20 20 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e           p->sIn.
3e90: 69 2b 2b 3b 0a 20 20 20 20 20 20 20 20 20 20 20  i++;.           
3ea0: 20 63 20 3d 20 70 2d 3e 78 4e 65 78 74 43 68 61   c = p->xNextCha
3eb0: 72 28 26 70 2d 3e 73 49 6e 29 3b 0a 20 20 20 20  r(&p->sIn);.    
3ec0: 20 20 20 20 20 20 20 20 69 66 28 20 63 3d 3d 27          if( c=='
3ed0: 5c 5c 27 20 29 20 63 20 3d 20 72 65 5f 65 73 63  \\' ) c = re_esc
3ee0: 5f 63 68 61 72 28 70 29 3b 0a 20 20 20 20 20 20  _char(p);.      
3ef0: 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28        re_append(
3f00: 70 2c 20 52 45 5f 4f 50 5f 43 43 5f 52 41 4e 47  p, RE_OP_CC_RANG
3f10: 45 2c 20 63 29 3b 0a 20 20 20 20 20 20 20 20 20  E, c);.         
3f20: 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20 20 20   }else{.        
3f30: 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70 2c      re_append(p,
3f40: 20 52 45 5f 4f 50 5f 43 43 5f 56 41 4c 55 45 2c   RE_OP_CC_VALUE,
3f50: 20 63 29 3b 0a 20 20 20 20 20 20 20 20 20 20 7d   c);.          }
3f60: 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20 72  .          if( r
3f70: 65 50 65 65 6b 28 70 29 3d 3d 27 5d 27 20 29 7b  ePeek(p)==']' ){
3f80: 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 20 62 72 65   p->sIn.i++; bre
3f90: 61 6b 3b 20 7d 0a 20 20 20 20 20 20 20 20 7d 0a  ak; }.        }.
3fa0: 20 20 20 20 20 20 20 20 69 66 28 20 63 3d 3d 30          if( c==0
3fb0: 20 29 20 72 65 74 75 72 6e 20 22 75 6e 63 6c 6f   ) return "unclo
3fc0: 73 65 64 20 27 5b 27 22 3b 0a 20 20 20 20 20 20  sed '['";.      
3fd0: 20 20 70 2d 3e 61 41 72 67 5b 69 46 69 72 73 74    p->aArg[iFirst
3fe0: 5d 20 3d 20 70 2d 3e 6e 53 74 61 74 65 20 2d 20  ] = p->nState - 
3ff0: 69 46 69 72 73 74 3b 0a 20 20 20 20 20 20 20 20  iFirst;.        
4000: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20  break;.      }. 
4010: 20 20 20 20 20 63 61 73 65 20 27 5c 5c 27 3a 20       case '\\': 
4020: 7b 0a 20 20 20 20 20 20 20 20 69 6e 74 20 73 70  {.        int sp
4030: 65 63 69 61 6c 4f 70 20 3d 20 30 3b 0a 20 20 20  ecialOp = 0;.   
4040: 20 20 20 20 20 73 77 69 74 63 68 28 20 72 65 50       switch( reP
4050: 65 65 6b 28 70 29 20 29 7b 0a 20 20 20 20 20 20  eek(p) ){.      
4060: 20 20 20 20 63 61 73 65 20 27 62 27 3a 20 73 70      case 'b': sp
4070: 65 63 69 61 6c 4f 70 20 3d 20 52 45 5f 4f 50 5f  ecialOp = RE_OP_
4080: 42 4f 55 4e 44 41 52 59 3b 20 20 20 62 72 65 61  BOUNDARY;   brea
4090: 6b 3b 0a 20 20 20 20 20 20 20 20 20 20 63 61 73  k;.          cas
40a0: 65 20 27 64 27 3a 20 73 70 65 63 69 61 6c 4f 70  e 'd': specialOp
40b0: 20 3d 20 52 45 5f 4f 50 5f 44 49 47 49 54 3b 20   = RE_OP_DIGIT; 
40c0: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
40d0: 20 20 20 20 20 20 63 61 73 65 20 27 44 27 3a 20        case 'D': 
40e0: 73 70 65 63 69 61 6c 4f 70 20 3d 20 52 45 5f 4f  specialOp = RE_O
40f0: 50 5f 4e 4f 54 44 49 47 49 54 3b 20 20 20 62 72  P_NOTDIGIT;   br
4100: 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 20 20 63  eak;.          c
4110: 61 73 65 20 27 73 27 3a 20 73 70 65 63 69 61 6c  ase 's': special
4120: 4f 70 20 3d 20 52 45 5f 4f 50 5f 53 50 41 43 45  Op = RE_OP_SPACE
4130: 3b 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20  ;      break;.  
4140: 20 20 20 20 20 20 20 20 63 61 73 65 20 27 53 27          case 'S'
4150: 3a 20 73 70 65 63 69 61 6c 4f 70 20 3d 20 52 45  : specialOp = RE
4160: 5f 4f 50 5f 4e 4f 54 53 50 41 43 45 3b 20 20 20  _OP_NOTSPACE;   
4170: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 20  break;.         
4180: 20 63 61 73 65 20 27 77 27 3a 20 73 70 65 63 69   case 'w': speci
4190: 61 6c 4f 70 20 3d 20 52 45 5f 4f 50 5f 57 4f 52  alOp = RE_OP_WOR
41a0: 44 3b 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a  D;       break;.
41b0: 20 20 20 20 20 20 20 20 20 20 63 61 73 65 20 27            case '
41c0: 57 27 3a 20 73 70 65 63 69 61 6c 4f 70 20 3d 20  W': specialOp = 
41d0: 52 45 5f 4f 50 5f 4e 4f 54 57 4f 52 44 3b 20 20  RE_OP_NOTWORD;  
41e0: 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20    break;.       
41f0: 20 7d 0a 20 20 20 20 20 20 20 20 69 66 28 20 73   }.        if( s
4200: 70 65 63 69 61 6c 4f 70 20 29 7b 0a 20 20 20 20  pecialOp ){.    
4210: 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b        p->sIn.i++
4220: 3b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61  ;.          re_a
4230: 70 70 65 6e 64 28 70 2c 20 73 70 65 63 69 61 6c  ppend(p, special
4240: 4f 70 2c 20 30 29 3b 0a 20 20 20 20 20 20 20 20  Op, 0);.        
4250: 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20 20 20 20  }else{.         
4260: 20 63 20 3d 20 72 65 5f 65 73 63 5f 63 68 61 72   c = re_esc_char
4270: 28 70 29 3b 0a 20 20 20 20 20 20 20 20 20 20 72  (p);.          r
4280: 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f  e_append(p, RE_O
4290: 50 5f 4d 41 54 43 48 2c 20 63 29 3b 0a 20 20 20  P_MATCH, c);.   
42a0: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 62       }.        b
42b0: 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20  reak;.      }.  
42c0: 20 20 20 20 64 65 66 61 75 6c 74 3a 20 7b 0a 20      default: {. 
42d0: 20 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64         re_append
42e0: 28 70 2c 20 52 45 5f 4f 50 5f 4d 41 54 43 48 2c  (p, RE_OP_MATCH,
42f0: 20 63 29 3b 0a 20 20 20 20 20 20 20 20 62 72 65   c);.        bre
4300: 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20  ak;.      }.    
4310: 7d 0a 20 20 20 20 69 50 72 65 76 20 3d 20 69 53  }.    iPrev = iS
4320: 74 61 72 74 3b 0a 20 20 7d 0a 20 20 72 65 74 75  tart;.  }.  retu
4330: 72 6e 20 30 3b 0a 7d 0a 0a 2f 2a 20 46 72 65 65  rn 0;.}../* Free
4340: 20 61 6e 64 20 72 65 63 6c 61 69 6d 20 61 6c 6c   and reclaim all
4350: 20 74 68 65 20 6d 65 6d 6f 72 79 20 75 73 65 64   the memory used
4360: 20 62 79 20 61 20 70 72 65 76 69 6f 75 73 6c 79   by a previously
4370: 20 63 6f 6d 70 69 6c 65 64 0a 2a 2a 20 72 65 67   compiled.** reg
4380: 75 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 2e  ular expression.
4390: 20 20 41 70 70 6c 69 63 61 74 69 6f 6e 73 20 73    Applications s
43a0: 68 6f 75 6c 64 20 69 6e 76 6f 6b 65 20 74 68 69  hould invoke thi
43b0: 73 20 72 6f 75 74 69 6e 65 20 6f 6e 63 65 0a 2a  s routine once.*
43c0: 2a 20 66 6f 72 20 65 76 65 72 79 20 63 61 6c 6c  * for every call
43d0: 20 74 6f 20 72 65 5f 63 6f 6d 70 69 6c 65 28 29   to re_compile()
43e0: 20 74 6f 20 61 76 6f 69 64 20 6d 65 6d 6f 72 79   to avoid memory
43f0: 20 6c 65 61 6b 73 2e 0a 2a 2f 0a 76 6f 69 64 20   leaks..*/.void 
4400: 72 65 5f 66 72 65 65 28 52 65 43 6f 6d 70 69 6c  re_free(ReCompil
4410: 65 64 20 2a 70 52 65 29 7b 0a 20 20 69 66 28 20  ed *pRe){.  if( 
4420: 70 52 65 20 29 7b 0a 20 20 20 20 66 6f 73 73 69  pRe ){.    fossi
4430: 6c 5f 66 72 65 65 28 70 52 65 2d 3e 61 4f 70 29  l_free(pRe->aOp)
4440: 3b 0a 20 20 20 20 66 6f 73 73 69 6c 5f 66 72 65  ;.    fossil_fre
4450: 65 28 70 52 65 2d 3e 61 41 72 67 29 3b 0a 20 20  e(pRe->aArg);.  
4460: 20 20 66 6f 73 73 69 6c 5f 66 72 65 65 28 70 52    fossil_free(pR
4470: 65 29 3b 0a 20 20 7d 0a 7d 0a 0a 2f 2a 0a 2a 2a  e);.  }.}../*.**
4480: 20 43 6f 6d 70 69 6c 65 20 61 20 74 65 78 74 75   Compile a textu
4490: 61 6c 20 72 65 67 75 6c 61 72 20 65 78 70 72 65  al regular expre
44a0: 73 73 69 6f 6e 20 69 6e 20 7a 49 6e 5b 5d 20 69  ssion in zIn[] i
44b0: 6e 74 6f 20 61 20 63 6f 6d 70 69 6c 65 64 20 72  nto a compiled r
44c0: 65 67 75 6c 61 72 0a 2a 2a 20 65 78 70 72 65 73  egular.** expres
44d0: 73 69 6f 6e 20 73 75 69 74 61 62 6c 65 20 66 6f  sion suitable fo
44e0: 72 20 75 73 20 62 79 20 72 65 5f 6d 61 74 63 68  r us by re_match
44f0: 28 29 20 61 6e 64 20 72 65 74 75 72 6e 20 61 20  () and return a 
4500: 70 6f 69 6e 74 65 72 20 74 6f 20 74 68 65 0a 2a  pointer to the.*
4510: 2a 20 63 6f 6d 70 69 6c 65 64 20 72 65 67 75 6c  * compiled regul
4520: 61 72 20 65 78 70 72 65 73 73 69 6f 6e 20 69 6e  ar expression in
4530: 20 2a 70 70 52 65 2e 20 20 52 65 74 75 72 6e 20   *ppRe.  Return 
4540: 4e 55 4c 4c 20 6f 6e 20 73 75 63 63 65 73 73 20  NULL on success 
4550: 6f 72 20 61 6e 0a 2a 2a 20 65 72 72 6f 72 20 6d  or an.** error m
4560: 65 73 73 61 67 65 20 69 66 20 73 6f 6d 65 74 68  essage if someth
4570: 69 6e 67 20 67 6f 65 73 20 77 72 6f 6e 67 2e 0a  ing goes wrong..
4580: 2a 2f 0a 63 6f 6e 73 74 20 63 68 61 72 20 2a 72  */.const char *r
4590: 65 5f 63 6f 6d 70 69 6c 65 28 52 65 43 6f 6d 70  e_compile(ReComp
45a0: 69 6c 65 64 20 2a 2a 70 70 52 65 2c 20 63 6f 6e  iled **ppRe, con
45b0: 73 74 20 63 68 61 72 20 2a 7a 49 6e 2c 20 69 6e  st char *zIn, in
45c0: 74 20 6e 6f 43 61 73 65 29 7b 0a 20 20 52 65 43  t noCase){.  ReC
45d0: 6f 6d 70 69 6c 65 64 20 2a 70 52 65 3b 0a 20 20  ompiled *pRe;.  
45e0: 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a 45 72 72  const char *zErr
45f0: 3b 0a 20 20 69 6e 74 20 69 2c 20 6a 3b 0a 0a 20  ;.  int i, j;.. 
4600: 20 2a 70 70 52 65 20 3d 20 30 3b 0a 20 20 70 52   *ppRe = 0;.  pR
4610: 65 20 3d 20 66 6f 73 73 69 6c 5f 6d 61 6c 6c 6f  e = fossil_mallo
4620: 63 28 20 73 69 7a 65 6f 66 28 2a 70 52 65 29 20  c( sizeof(*pRe) 
4630: 29 3b 0a 20 20 69 66 28 20 70 52 65 3d 3d 30 20  );.  if( pRe==0 
4640: 29 7b 0a 20 20 20 20 72 65 74 75 72 6e 20 22 6f  ){.    return "o
4650: 75 74 20 6f 66 20 6d 65 6d 6f 72 79 22 3b 0a 20  ut of memory";. 
4660: 20 7d 0a 20 20 6d 65 6d 73 65 74 28 70 52 65 2c   }.  memset(pRe,
4670: 20 30 2c 20 73 69 7a 65 6f 66 28 2a 70 52 65 29   0, sizeof(*pRe)
4680: 29 3b 0a 20 20 70 52 65 2d 3e 78 4e 65 78 74 43  );.  pRe->xNextC
4690: 68 61 72 20 3d 20 6e 6f 43 61 73 65 20 3f 20 72  har = noCase ? r
46a0: 65 5f 6e 65 78 74 5f 63 68 61 72 5f 6e 6f 63 61  e_next_char_noca
46b0: 73 65 20 3a 20 72 65 5f 6e 65 78 74 5f 63 68 61  se : re_next_cha
46c0: 72 3b 0a 20 20 69 66 28 20 72 65 5f 72 65 73 69  r;.  if( re_resi
46d0: 7a 65 28 70 52 65 2c 20 33 30 29 20 29 7b 0a 20  ze(pRe, 30) ){. 
46e0: 20 20 20 72 65 5f 66 72 65 65 28 70 52 65 29 3b     re_free(pRe);
46f0: 0a 20 20 20 20 72 65 74 75 72 6e 20 22 6f 75 74  .    return "out
4700: 20 6f 66 20 6d 65 6d 6f 72 79 22 3b 0a 20 20 7d   of memory";.  }
4710: 0a 20 20 69 66 28 20 7a 49 6e 5b 30 5d 3d 3d 27  .  if( zIn[0]=='
4720: 5e 27 20 29 7b 0a 20 20 20 20 7a 49 6e 2b 2b 3b  ^' ){.    zIn++;
4730: 0a 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 72 65  .  }else{.    re
4740: 5f 61 70 70 65 6e 64 28 70 52 65 2c 20 52 45 5f  _append(pRe, RE_
4750: 4f 50 5f 41 4e 59 53 54 41 52 2c 20 30 29 3b 0a  OP_ANYSTAR, 0);.
4760: 20 20 7d 0a 20 20 70 52 65 2d 3e 73 49 6e 2e 7a    }.  pRe->sIn.z
4770: 20 3d 20 28 75 6e 73 69 67 6e 65 64 20 63 68 61   = (unsigned cha
4780: 72 2a 29 7a 49 6e 3b 0a 20 20 70 52 65 2d 3e 73  r*)zIn;.  pRe->s
4790: 49 6e 2e 69 20 3d 20 30 3b 0a 20 20 70 52 65 2d  In.i = 0;.  pRe-
47a0: 3e 73 49 6e 2e 6d 78 20 3d 20 28 69 6e 74 29 73  >sIn.mx = (int)s
47b0: 74 72 6c 65 6e 28 7a 49 6e 29 3b 0a 20 20 7a 45  trlen(zIn);.  zE
47c0: 72 72 20 3d 20 72 65 5f 73 75 62 63 6f 6d 70 69  rr = re_subcompi
47d0: 6c 65 5f 72 65 28 70 52 65 29 3b 0a 20 20 69 66  le_re(pRe);.  if
47e0: 28 20 7a 45 72 72 20 29 7b 0a 20 20 20 20 72 65  ( zErr ){.    re
47f0: 5f 66 72 65 65 28 70 52 65 29 3b 0a 20 20 20 20  _free(pRe);.    
4800: 72 65 74 75 72 6e 20 7a 45 72 72 3b 0a 20 20 7d  return zErr;.  }
4810: 0a 20 20 69 66 28 20 72 65 50 65 65 6b 28 70 52  .  if( rePeek(pR
4820: 65 29 3d 3d 27 24 27 20 26 26 20 70 52 65 2d 3e  e)=='$' && pRe->
4830: 73 49 6e 2e 69 2b 31 3e 3d 70 52 65 2d 3e 73 49  sIn.i+1>=pRe->sI
4840: 6e 2e 6d 78 20 29 7b 0a 20 20 20 20 72 65 5f 61  n.mx ){.    re_a
4850: 70 70 65 6e 64 28 70 52 65 2c 20 52 45 5f 4f 50  ppend(pRe, RE_OP
4860: 5f 4d 41 54 43 48 2c 20 52 45 5f 45 4f 46 29 3b  _MATCH, RE_EOF);
4870: 0a 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70  .    re_append(p
4880: 52 65 2c 20 52 45 5f 4f 50 5f 41 43 43 45 50 54  Re, RE_OP_ACCEPT
4890: 2c 20 30 29 3b 0a 20 20 20 20 2a 70 70 52 65 20  , 0);.    *ppRe 
48a0: 3d 20 70 52 65 3b 0a 20 20 7d 65 6c 73 65 20 69  = pRe;.  }else i
48b0: 66 28 20 70 52 65 2d 3e 73 49 6e 2e 69 3e 3d 70  f( pRe->sIn.i>=p
48c0: 52 65 2d 3e 73 49 6e 2e 6d 78 20 29 7b 0a 20 20  Re->sIn.mx ){.  
48d0: 20 20 72 65 5f 61 70 70 65 6e 64 28 70 52 65 2c    re_append(pRe,
48e0: 20 52 45 5f 4f 50 5f 41 43 43 45 50 54 2c 20 30   RE_OP_ACCEPT, 0
48f0: 29 3b 0a 20 20 20 20 2a 70 70 52 65 20 3d 20 70  );.    *ppRe = p
4900: 52 65 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20 20 20  Re;.  }else{.   
4910: 20 72 65 5f 66 72 65 65 28 70 52 65 29 3b 0a 20   re_free(pRe);. 
4920: 20 20 20 72 65 74 75 72 6e 20 22 75 6e 72 65 63     return "unrec
4930: 6f 67 6e 69 7a 65 64 20 63 68 61 72 61 63 74 65  ognized characte
4940: 72 22 3b 0a 20 20 7d 0a 0a 20 20 2f 2a 20 54 68  r";.  }..  /* Th
4950: 65 20 66 6f 6c 6c 6f 77 69 6e 67 20 69 73 20 61  e following is a
4960: 20 70 65 72 66 6f 72 6d 61 6e 63 65 20 6f 70 74   performance opt
4970: 69 6d 69 7a 61 74 69 6f 6e 2e 20 20 49 66 20 74  imization.  If t
4980: 68 65 20 72 65 67 65 78 20 62 65 67 69 6e 73 20  he regex begins 
4990: 77 69 74 68 0a 20 20 2a 2a 20 22 2e 2a 22 20 28  with.  ** ".*" (
49a0: 69 66 20 74 68 65 20 69 6e 70 75 74 20 72 65 67  if the input reg
49b0: 65 78 20 6c 61 63 6b 73 20 61 6e 20 69 6e 69 74  ex lacks an init
49c0: 69 61 6c 20 22 5e 22 29 20 61 6e 64 20 61 66 74  ial "^") and aft
49d0: 65 72 77 61 72 64 73 20 74 68 65 72 65 20 61 72  erwards there ar
49e0: 65 0a 20 20 2a 2a 20 6f 6e 65 20 6f 72 20 6d 6f  e.  ** one or mo
49f0: 72 65 20 6d 61 74 63 68 69 6e 67 20 63 68 61 72  re matching char
4a00: 61 63 74 65 72 73 2c 20 65 6e 74 65 72 20 74 68  acters, enter th
4a10: 6f 73 65 20 6d 61 74 63 68 69 6e 67 20 63 68 61  ose matching cha
4a20: 72 61 63 74 65 72 73 20 69 6e 74 6f 0a 20 20 2a  racters into.  *
4a30: 2a 20 7a 49 6e 69 74 5b 5d 2e 20 20 54 68 65 20  * zInit[].  The 
4a40: 72 65 5f 6d 61 74 63 68 28 29 20 72 6f 75 74 69  re_match() routi
4a50: 6e 65 20 63 61 6e 20 74 68 65 6e 20 73 65 61 72  ne can then sear
4a60: 63 68 20 61 68 65 61 64 20 69 6e 20 74 68 65 20  ch ahead in the 
4a70: 69 6e 70 75 74 0a 20 20 2a 2a 20 73 74 72 69 6e  input.  ** strin
4a80: 67 20 6c 6f 6f 6b 69 6e 67 20 66 6f 72 20 74 68  g looking for th
4a90: 65 20 69 6e 69 74 69 61 6c 20 6d 61 74 63 68 20  e initial match 
4aa0: 77 69 74 68 6f 75 74 20 68 61 76 69 6e 67 20 74  without having t
4ab0: 6f 20 72 75 6e 20 74 68 65 20 77 68 6f 6c 65 0a  o run the whole.
4ac0: 20 20 2a 2a 20 72 65 67 65 78 20 65 6e 67 69 6e    ** regex engin
4ad0: 65 20 6f 76 65 72 20 74 68 65 20 73 74 72 69 6e  e over the strin
4ae0: 67 2e 20 20 44 6f 20 6e 6f 74 20 77 6f 72 72 79  g.  Do not worry
4af0: 20 61 62 6c 65 20 74 72 79 69 6e 67 20 74 6f 20   able trying to 
4b00: 6d 61 74 63 68 0a 20 20 2a 2a 20 75 6e 69 63 6f  match.  ** unico
4b10: 64 65 20 63 68 61 72 61 63 74 65 72 73 20 62 65  de characters be
4b20: 79 6f 6e 64 20 70 6c 61 6e 65 20 30 20 2d 20 74  yond plane 0 - t
4b30: 68 6f 73 65 20 61 72 65 20 76 65 72 79 20 72 61  hose are very ra
4b40: 72 65 20 61 6e 64 20 74 68 69 73 20 69 73 0a 20  re and this is. 
4b50: 20 2a 2a 20 6a 75 73 74 20 61 6e 20 6f 70 74 69   ** just an opti
4b60: 6d 69 7a 61 74 69 6f 6e 2e 20 2a 2f 0a 20 20 69  mization. */.  i
4b70: 66 28 20 70 52 65 2d 3e 61 4f 70 5b 30 5d 3d 3d  f( pRe->aOp[0]==
4b80: 52 45 5f 4f 50 5f 41 4e 59 53 54 41 52 20 29 7b  RE_OP_ANYSTAR ){
4b90: 0a 20 20 20 20 66 6f 72 28 6a 3d 30 2c 20 69 3d  .    for(j=0, i=
4ba0: 31 3b 20 6a 3c 73 69 7a 65 6f 66 28 70 52 65 2d  1; j<sizeof(pRe-
4bb0: 3e 7a 49 6e 69 74 29 2d 32 20 26 26 20 70 52 65  >zInit)-2 && pRe
4bc0: 2d 3e 61 4f 70 5b 69 5d 3d 3d 52 45 5f 4f 50 5f  ->aOp[i]==RE_OP_
4bd0: 4d 41 54 43 48 3b 20 69 2b 2b 29 7b 0a 20 20 20  MATCH; i++){.   
4be0: 20 20 20 75 6e 73 69 67 6e 65 64 20 78 20 3d 20     unsigned x = 
4bf0: 70 52 65 2d 3e 61 41 72 67 5b 69 5d 3b 0a 20 20  pRe->aArg[i];.  
4c00: 20 20 20 20 69 66 28 20 78 3c 3d 31 32 37 20 29      if( x<=127 )
4c10: 7b 0a 20 20 20 20 20 20 20 20 70 52 65 2d 3e 7a  {.        pRe->z
4c20: 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20 28 75 6e 73  Init[j++] = (uns
4c30: 69 67 6e 65 64 20 63 68 61 72 29 78 3b 0a 20 20  igned char)x;.  
4c40: 20 20 20 20 7d 65 6c 73 65 20 69 66 28 20 78 3c      }else if( x<
4c50: 3d 30 78 66 66 66 20 29 7b 0a 20 20 20 20 20 20  =0xfff ){.      
4c60: 20 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b    pRe->zInit[j++
4c70: 5d 20 3d 20 28 75 6e 73 69 67 6e 65 64 20 63 68  ] = (unsigned ch
4c80: 61 72 29 28 30 78 63 30 20 7c 20 28 78 3e 3e 36  ar)(0xc0 | (x>>6
4c90: 29 29 3b 0a 20 20 20 20 20 20 20 20 70 52 65 2d  ));.        pRe-
4ca0: 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20 30 78  >zInit[j++] = 0x
4cb0: 38 30 20 7c 20 28 78 26 30 78 33 66 29 3b 0a 20  80 | (x&0x3f);. 
4cc0: 20 20 20 20 20 7d 65 6c 73 65 20 69 66 28 20 78       }else if( x
4cd0: 3c 3d 30 78 66 66 66 66 20 29 7b 0a 20 20 20 20  <=0xffff ){.    
4ce0: 20 20 20 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a      pRe->zInit[j
4cf0: 2b 2b 5d 20 3d 20 28 75 6e 73 69 67 6e 65 64 20  ++] = (unsigned 
4d00: 63 68 61 72 29 28 30 78 64 30 20 7c 20 28 78 3e  char)(0xd0 | (x>
4d10: 3e 31 32 29 29 3b 0a 20 20 20 20 20 20 20 20 70  >12));.        p
4d20: 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20 3d  Re->zInit[j++] =
4d30: 20 30 78 38 30 20 7c 20 28 28 78 3e 3e 36 29 26   0x80 | ((x>>6)&
4d40: 30 78 33 66 29 3b 0a 20 20 20 20 20 20 20 20 70  0x3f);.        p
4d50: 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20 3d  Re->zInit[j++] =
4d60: 20 30 78 38 30 20 7c 20 28 78 26 30 78 33 66 29   0x80 | (x&0x3f)
4d70: 3b 0a 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20  ;.      }else{. 
4d80: 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20         break;.  
4d90: 20 20 20 20 7d 0a 20 20 20 20 7d 0a 20 20 20 20      }.    }.    
4da0: 69 66 28 20 6a 3e 30 20 26 26 20 70 52 65 2d 3e  if( j>0 && pRe->
4db0: 7a 49 6e 69 74 5b 6a 2d 31 5d 3d 3d 30 20 29 20  zInit[j-1]==0 ) 
4dc0: 6a 2d 2d 3b 0a 20 20 20 20 70 52 65 2d 3e 6e 49  j--;.    pRe->nI
4dd0: 6e 69 74 20 3d 20 6a 3b 0a 20 20 7d 0a 20 20 72  nit = j;.  }.  r
4de0: 65 74 75 72 6e 20 70 52 65 2d 3e 7a 45 72 72 3b  eturn pRe->zErr;
4df0: 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 49 6d 70 6c 65 6d  .}../*.** Implem
4e00: 65 6e 74 61 74 69 6f 6e 20 6f 66 20 74 68 65 20  entation of the 
4e10: 72 65 67 65 78 70 28 29 20 53 51 4c 20 66 75 6e  regexp() SQL fun
4e20: 63 74 69 6f 6e 2e 20 20 54 68 69 73 20 66 75 6e  ction.  This fun
4e30: 63 74 69 6f 6e 20 69 6d 70 6c 65 6d 65 6e 74 73  ction implements
4e40: 0a 2a 2a 20 74 68 65 20 62 75 69 6c 64 2d 69 6e  .** the build-in
4e50: 20 52 45 47 45 58 50 20 6f 70 65 72 61 74 6f 72   REGEXP operator
4e60: 2e 20 20 54 68 65 20 66 69 72 73 74 20 61 72 67  .  The first arg
4e70: 75 6d 65 6e 74 20 74 6f 20 74 68 65 20 66 75 6e  ument to the fun
4e80: 63 74 69 6f 6e 20 69 73 20 74 68 65 0a 2a 2a 20  ction is the.** 
4e90: 70 61 74 74 65 72 6e 20 61 6e 64 20 74 68 65 20  pattern and the 
4ea0: 73 65 63 6f 6e 64 20 61 72 67 75 6d 65 6e 74 20  second argument 
4eb0: 69 73 20 74 68 65 20 73 74 72 69 6e 67 2e 20 20  is the string.  
4ec0: 53 6f 2c 20 74 68 65 20 53 51 4c 20 73 74 61 74  So, the SQL stat
4ed0: 65 6d 65 6e 74 73 3a 0a 2a 2a 0a 2a 2a 20 20 20  ements:.**.**   
4ee0: 20 20 20 20 41 20 52 45 47 45 58 50 20 42 0a 2a      A REGEXP B.*
4ef0: 2a 0a 2a 2a 20 69 73 20 69 6d 70 6c 65 6d 65 6e  *.** is implemen
4f00: 74 65 64 20 61 73 20 72 65 67 65 78 70 28 42 2c  ted as regexp(B,
4f10: 41 29 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 76 6f  A)..*/.static vo
4f20: 69 64 20 72 65 5f 73 71 6c 5f 66 75 6e 63 28 0a  id re_sql_func(.
4f30: 20 20 73 71 6c 69 74 65 33 5f 63 6f 6e 74 65 78    sqlite3_contex
4f40: 74 20 2a 63 6f 6e 74 65 78 74 2c 0a 20 20 69 6e  t *context,.  in
4f50: 74 20 61 72 67 63 2c 0a 20 20 73 71 6c 69 74 65  t argc,.  sqlite
4f60: 33 5f 76 61 6c 75 65 20 2a 2a 61 72 67 76 0a 29  3_value **argv.)
4f70: 7b 0a 20 20 52 65 43 6f 6d 70 69 6c 65 64 20 2a  {.  ReCompiled *
4f80: 70 52 65 3b 20 20 20 20 20 20 20 20 20 20 2f 2a  pRe;          /*
4f90: 20 43 6f 6d 70 69 6c 65 64 20 72 65 67 75 6c 61   Compiled regula
4fa0: 72 20 65 78 70 72 65 73 73 69 6f 6e 20 2a 2f 0a  r expression */.
4fb0: 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a 50    const char *zP
4fc0: 61 74 74 65 72 6e 3b 20 20 20 20 20 2f 2a 20 54  attern;     /* T
4fd0: 68 65 20 72 65 67 75 6c 61 72 20 65 78 70 72 65  he regular expre
4fe0: 73 73 69 6f 6e 20 2a 2f 0a 20 20 63 6f 6e 73 74  ssion */.  const
4ff0: 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20 2a   unsigned char *
5000: 7a 53 74 72 3b 2f 2a 20 53 74 72 69 6e 67 20 62  zStr;/* String b
5010: 65 69 6e 67 20 73 65 61 72 63 68 65 64 20 2a 2f  eing searched */
5020: 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a  .  const char *z
5030: 45 72 72 3b 20 20 20 20 20 20 20 20 20 2f 2a 20  Err;         /* 
5040: 43 6f 6d 70 69 6c 65 20 65 72 72 6f 72 20 6d 65  Compile error me
5050: 73 73 61 67 65 20 2a 2f 0a 20 20 69 6e 74 20 73  ssage */.  int s
5060: 65 74 41 75 78 20 3d 20 30 3b 20 20 20 20 20 20  etAux = 0;      
5070: 20 20 20 20 20 2f 2a 20 54 72 75 65 20 74 6f 20       /* True to 
5080: 69 6e 76 6f 6b 65 20 73 71 6c 69 74 65 33 5f 73  invoke sqlite3_s
5090: 65 74 5f 61 75 78 64 61 74 61 28 29 20 2a 2f 0a  et_auxdata() */.
50a0: 0a 20 20 70 52 65 20 3d 20 73 71 6c 69 74 65 33  .  pRe = sqlite3
50b0: 5f 67 65 74 5f 61 75 78 64 61 74 61 28 63 6f 6e  _get_auxdata(con
50c0: 74 65 78 74 2c 20 30 29 3b 0a 20 20 69 66 28 20  text, 0);.  if( 
50d0: 70 52 65 3d 3d 30 20 29 7b 0a 20 20 20 20 7a 50  pRe==0 ){.    zP
50e0: 61 74 74 65 72 6e 20 3d 20 28 63 6f 6e 73 74 20  attern = (const 
50f0: 63 68 61 72 2a 29 73 71 6c 69 74 65 33 5f 76 61  char*)sqlite3_va
5100: 6c 75 65 5f 74 65 78 74 28 61 72 67 76 5b 30 5d  lue_text(argv[0]
5110: 29 3b 0a 20 20 20 20 69 66 28 20 7a 50 61 74 74  );.    if( zPatt
5120: 65 72 6e 3d 3d 30 20 29 20 72 65 74 75 72 6e 3b  ern==0 ) return;
5130: 0a 20 20 20 20 7a 45 72 72 20 3d 20 72 65 5f 63  .    zErr = re_c
5140: 6f 6d 70 69 6c 65 28 26 70 52 65 2c 20 7a 50 61  ompile(&pRe, zPa
5150: 74 74 65 72 6e 2c 20 30 29 3b 0a 20 20 20 20 69  ttern, 0);.    i
5160: 66 28 20 7a 45 72 72 20 29 7b 0a 20 20 20 20 20  f( zErr ){.     
5170: 20 72 65 5f 66 72 65 65 28 70 52 65 29 3b 0a 20   re_free(pRe);. 
5180: 20 20 20 20 20 73 71 6c 69 74 65 33 5f 72 65 73       sqlite3_res
5190: 75 6c 74 5f 65 72 72 6f 72 28 63 6f 6e 74 65 78  ult_error(contex
51a0: 74 2c 20 7a 45 72 72 2c 20 2d 31 29 3b 0a 20 20  t, zErr, -1);.  
51b0: 20 20 20 20 72 65 74 75 72 6e 3b 0a 20 20 20 20      return;.    
51c0: 7d 0a 20 20 20 20 69 66 28 20 70 52 65 3d 3d 30  }.    if( pRe==0
51d0: 20 29 7b 0a 20 20 20 20 20 20 73 71 6c 69 74 65   ){.      sqlite
51e0: 33 5f 72 65 73 75 6c 74 5f 65 72 72 6f 72 5f 6e  3_result_error_n
51f0: 6f 6d 65 6d 28 63 6f 6e 74 65 78 74 29 3b 0a 20  omem(context);. 
5200: 20 20 20 20 20 72 65 74 75 72 6e 3b 0a 20 20 20       return;.   
5210: 20 7d 0a 20 20 20 20 73 65 74 41 75 78 20 3d 20   }.    setAux = 
5220: 31 3b 0a 20 20 7d 0a 20 20 7a 53 74 72 20 3d 20  1;.  }.  zStr = 
5230: 28 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 20  (const unsigned 
5240: 63 68 61 72 2a 29 73 71 6c 69 74 65 33 5f 76 61  char*)sqlite3_va
5250: 6c 75 65 5f 74 65 78 74 28 61 72 67 76 5b 31 5d  lue_text(argv[1]
5260: 29 3b 0a 20 20 69 66 28 20 7a 53 74 72 21 3d 30  );.  if( zStr!=0
5270: 20 29 7b 0a 20 20 20 20 73 71 6c 69 74 65 33 5f   ){.    sqlite3_
5280: 72 65 73 75 6c 74 5f 69 6e 74 28 63 6f 6e 74 65  result_int(conte
5290: 78 74 2c 20 72 65 5f 6d 61 74 63 68 28 70 52 65  xt, re_match(pRe
52a0: 2c 20 7a 53 74 72 2c 20 2d 31 29 29 3b 0a 20 20  , zStr, -1));.  
52b0: 7d 0a 20 20 69 66 28 20 73 65 74 41 75 78 20 29  }.  if( setAux )
52c0: 7b 0a 20 20 20 20 73 71 6c 69 74 65 33 5f 73 65  {.    sqlite3_se
52d0: 74 5f 61 75 78 64 61 74 61 28 63 6f 6e 74 65 78  t_auxdata(contex
52e0: 74 2c 20 30 2c 20 70 52 65 2c 20 28 76 6f 69 64  t, 0, pRe, (void
52f0: 28 2a 29 28 76 6f 69 64 2a 29 29 72 65 5f 66 72  (*)(void*))re_fr
5300: 65 65 29 3b 0a 20 20 7d 0a 7d 0a 0a 2f 2a 0a 2a  ee);.  }.}../*.*
5310: 2a 20 49 6e 76 6f 6b 65 20 74 68 69 73 20 72 6f  * Invoke this ro
5320: 75 74 69 6e 65 20 74 6f 20 72 65 67 69 73 74 65  utine to registe
5330: 72 20 74 68 65 20 72 65 67 65 78 70 28 29 20 66  r the regexp() f
5340: 75 6e 63 74 69 6f 6e 20 77 69 74 68 20 74 68 65  unction with the
5350: 0a 2a 2a 20 53 51 4c 69 74 65 20 64 61 74 61 62  .** SQLite datab
5360: 61 73 65 20 63 6f 6e 6e 65 63 74 69 6f 6e 2e 0a  ase connection..
5370: 2a 2f 0a 69 6e 74 20 72 65 5f 61 64 64 5f 73 71  */.int re_add_sq
5380: 6c 5f 66 75 6e 63 28 73 71 6c 69 74 65 33 20 2a  l_func(sqlite3 *
5390: 64 62 29 7b 0a 20 20 72 65 74 75 72 6e 20 73 71  db){.  return sq
53a0: 6c 69 74 65 33 5f 63 72 65 61 74 65 5f 66 75 6e  lite3_create_fun
53b0: 63 74 69 6f 6e 28 64 62 2c 20 22 72 65 67 65 78  ction(db, "regex
53c0: 70 22 2c 20 32 2c 20 53 51 4c 49 54 45 5f 55 54  p", 2, SQLITE_UT
53d0: 46 38 2c 20 30 2c 0a 20 20 20 20 20 20 20 20 20  F8, 0,.         
53e0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
53f0: 20 20 20 20 20 20 20 20 72 65 5f 73 71 6c 5f 66          re_sql_f
5400: 75 6e 63 2c 20 30 2c 20 30 29 3b 0a 7d 0a 0a 2f  unc, 0, 0);.}../
5410: 2a 0a 2a 2a 20 52 75 6e 20 61 20 22 67 72 65 70  *.** Run a "grep
5420: 22 20 6f 76 65 72 20 61 20 73 69 6e 67 6c 65 20  " over a single 
5430: 66 69 6c 65 20 72 65 61 64 20 66 72 6f 6d 20 64  file read from d
5440: 69 73 6b 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 76  isk..*/.static v
5450: 6f 69 64 20 67 72 65 70 5f 66 69 6c 65 28 52 65  oid grep_file(Re
5460: 43 6f 6d 70 69 6c 65 64 20 2a 70 52 65 2c 20 63  Compiled *pRe, c
5470: 6f 6e 73 74 20 63 68 61 72 20 2a 7a 46 69 6c 65  onst char *zFile
5480: 2c 20 46 49 4c 45 20 2a 69 6e 29 7b 0a 20 20 69  , FILE *in){.  i
5490: 6e 74 20 6c 6e 20 3d 20 30 3b 0a 20 20 69 6e 74  nt ln = 0;.  int
54a0: 20 6e 3b 0a 20 20 63 68 61 72 20 7a 4c 69 6e 65   n;.  char zLine
54b0: 5b 32 30 30 30 5d 3b 0a 20 20 77 68 69 6c 65 28  [2000];.  while(
54c0: 20 66 67 65 74 73 28 7a 4c 69 6e 65 2c 20 73 69   fgets(zLine, si
54d0: 7a 65 6f 66 28 7a 4c 69 6e 65 29 2c 20 69 6e 29  zeof(zLine), in)
54e0: 20 29 7b 0a 20 20 20 20 6c 6e 2b 2b 3b 0a 20 20   ){.    ln++;.  
54f0: 20 20 6e 20 3d 20 28 69 6e 74 29 73 74 72 6c 65    n = (int)strle
5500: 6e 28 7a 4c 69 6e 65 29 3b 0a 20 20 20 20 77 68  n(zLine);.    wh
5510: 69 6c 65 28 20 6e 20 26 26 20 28 7a 4c 69 6e 65  ile( n && (zLine
5520: 5b 6e 2d 31 5d 3d 3d 27 5c 6e 27 20 7c 7c 20 7a  [n-1]=='\n' || z
5530: 4c 69 6e 65 5b 6e 2d 31 5d 3d 3d 27 5c 72 27 29  Line[n-1]=='\r')
5540: 20 29 20 6e 2d 2d 3b 0a 20 20 20 20 69 66 28 20   ) n--;.    if( 
5550: 72 65 5f 6d 61 74 63 68 28 70 52 65 2c 20 28 63  re_match(pRe, (c
5560: 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 20 63 68  onst unsigned ch
5570: 61 72 2a 29 7a 4c 69 6e 65 2c 20 6e 29 20 29 7b  ar*)zLine, n) ){
5580: 0a 20 20 20 20 20 20 66 6f 73 73 69 6c 5f 70 72  .      fossil_pr
5590: 69 6e 74 28 22 25 73 3a 25 64 3a 25 2e 2a 73 5c  int("%s:%d:%.*s\
55a0: 6e 22 2c 20 7a 46 69 6c 65 2c 20 6c 6e 2c 20 6e  n", zFile, ln, n
55b0: 2c 20 7a 4c 69 6e 65 29 3b 0a 20 20 20 20 7d 0a  , zLine);.    }.
55c0: 20 20 7d 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 46 6c 61    }.}../*.** Fla
55d0: 67 73 20 66 6f 72 20 67 72 65 70 5f 62 75 66 66  gs for grep_buff
55e0: 65 72 28 29 0a 2a 2f 0a 23 64 65 66 69 6e 65 20  er().*/.#define 
55f0: 47 52 45 50 5f 45 58 49 53 54 53 20 20 20 20 30  GREP_EXISTS    0
5600: 78 30 30 31 20 20 20 20 2f 2a 20 49 66 20 61 6e  x001    /* If an
5610: 79 20 6d 61 74 63 68 2c 20 70 72 69 6e 74 20 6f  y match, print o
5620: 6e 6c 79 20 74 68 65 20 6e 61 6d 65 20 61 6e 64  nly the name and
5630: 20 73 74 6f 70 20 2a 2f 0a 0a 2f 2a 0a 2a 2a 20   stop */../*.** 
5640: 52 75 6e 20 61 20 22 67 72 65 70 22 20 6f 76 65  Run a "grep" ove
5650: 72 20 61 20 74 65 78 74 20 66 69 6c 65 0a 2a 2f  r a text file.*/
5660: 0a 73 74 61 74 69 63 20 69 6e 74 20 67 72 65 70  .static int grep
5670: 5f 62 75 66 66 65 72 28 0a 20 20 52 65 43 6f 6d  _buffer(.  ReCom
5680: 70 69 6c 65 64 20 2a 70 52 65 2c 0a 20 20 63 6f  piled *pRe,.  co
5690: 6e 73 74 20 63 68 61 72 20 2a 7a 4e 61 6d 65 2c  nst char *zName,
56a0: 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a  .  const char *z
56b0: 2c 0a 20 20 75 33 32 20 66 6c 61 67 73 0a 29 7b  ,.  u32 flags.){
56c0: 0a 20 20 69 6e 74 20 69 2c 20 6a 2c 20 6e 2c 20  .  int i, j, n, 
56d0: 6c 6e 2c 20 63 6e 74 3b 0a 20 20 66 6f 72 28 69  ln, cnt;.  for(i
56e0: 3d 6a 3d 6c 6e 3d 63 6e 74 3d 30 3b 20 7a 5b 69  =j=ln=cnt=0; z[i
56f0: 5d 3b 20 69 3d 6a 2b 31 29 7b 0a 20 20 20 20 66  ]; i=j+1){.    f
5700: 6f 72 28 6a 3d 69 3b 20 7a 5b 6a 5d 20 26 26 20  or(j=i; z[j] && 
5710: 7a 5b 6a 5d 21 3d 27 5c 6e 27 3b 20 6a 2b 2b 29  z[j]!='\n'; j++)
5720: 7b 7d 0a 20 20 20 20 6e 20 3d 20 6a 20 2d 20 69  {}.    n = j - i
5730: 3b 0a 20 20 20 20 69 66 28 20 7a 5b 6a 5d 3d 3d  ;.    if( z[j]==
5740: 27 5c 6e 27 20 29 20 6a 2b 2b 3b 0a 20 20 20 20  '\n' ) j++;.    
5750: 6c 6e 2b 2b 3b 0a 20 20 20 20 69 66 28 20 72 65  ln++;.    if( re
5760: 5f 6d 61 74 63 68 28 70 52 65 2c 20 28 63 6f 6e  _match(pRe, (con
5770: 73 74 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72  st unsigned char
5780: 2a 29 28 7a 2b 69 29 2c 20 6a 2d 69 29 20 29 7b  *)(z+i), j-i) ){
5790: 0a 20 20 20 20 20 20 63 6e 74 2b 2b 3b 0a 20 20  .      cnt++;.  
57a0: 20 20 20 20 69 66 28 20 66 6c 61 67 73 20 26 20      if( flags & 
57b0: 47 52 45 50 5f 45 58 49 53 54 53 20 29 7b 0a 20  GREP_EXISTS ){. 
57c0: 20 20 20 20 20 20 20 66 6f 73 73 69 6c 5f 70 72         fossil_pr
57d0: 69 6e 74 28 22 25 73 5c 6e 22 2c 20 7a 4e 61 6d  int("%s\n", zNam
57e0: 65 29 3b 0a 20 20 20 20 20 20 20 20 62 72 65 61  e);.        brea
57f0: 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20  k;.      }.     
5800: 20 66 6f 73 73 69 6c 5f 70 72 69 6e 74 28 22 25   fossil_print("%
5810: 73 3a 25 64 3a 25 2e 2a 73 5c 6e 22 2c 20 7a 4e  s:%d:%.*s\n", zN
5820: 61 6d 65 2c 20 6c 6e 2c 20 6e 2c 20 7a 2b 69 29  ame, ln, n, z+i)
5830: 3b 0a 20 20 20 20 7d 0a 20 20 7d 0a 20 20 72 65  ;.    }.  }.  re
5840: 74 75 72 6e 20 63 6e 74 3b 0a 7d 0a 0a 2f 2a 0a  turn cnt;.}../*.
5850: 2a 2a 20 43 4f 4d 4d 41 4e 44 3a 20 74 65 73 74  ** COMMAND: test
5860: 2d 67 72 65 70 0a 2a 2a 0a 2a 2a 20 55 73 61 67  -grep.**.** Usag
5870: 65 3a 20 25 66 6f 73 73 69 6c 20 74 65 73 74 2d  e: %fossil test-
5880: 67 72 65 70 20 52 45 47 45 58 50 20 5b 46 49 4c  grep REGEXP [FIL
5890: 45 2e 2e 2e 5d 0a 2a 2a 0a 2a 2a 20 52 75 6e 20  E...].**.** Run 
58a0: 61 20 72 65 67 75 6c 61 72 20 65 78 70 72 65 73  a regular expres
58b0: 73 69 6f 6e 20 6d 61 74 63 68 20 6f 76 65 72 20  sion match over 
58c0: 74 68 65 20 6e 61 6d 65 64 20 64 69 73 6b 20 66  the named disk f
58d0: 69 6c 65 73 2c 20 6f 72 20 61 67 61 69 6e 73 74  iles, or against
58e0: 0a 2a 2a 20 73 74 61 6e 64 61 72 64 20 69 6e 70  .** standard inp
58f0: 75 74 20 69 66 20 6e 6f 20 64 69 73 6b 20 66 69  ut if no disk fi
5900: 6c 65 73 20 61 72 65 20 6e 61 6d 65 64 20 6f 6e  les are named on
5910: 20 74 68 65 20 63 6f 6d 6d 61 6e 64 2d 6c 69 6e   the command-lin
5920: 65 2e 0a 2a 2a 0a 2a 2a 20 4f 70 74 69 6f 6e 73  e..**.** Options
5930: 3a 0a 2a 2a 0a 2a 2a 20 20 20 2d 69 7c 2d 2d 69  :.**.**   -i|--i
5940: 67 6e 6f 72 65 2d 63 61 73 65 20 20 20 20 49 67  gnore-case    Ig
5950: 6e 6f 72 65 20 63 61 73 65 0a 2a 2f 0a 76 6f 69  nore case.*/.voi
5960: 64 20 72 65 5f 74 65 73 74 5f 67 72 65 70 28 76  d re_test_grep(v
5970: 6f 69 64 29 7b 0a 20 20 52 65 43 6f 6d 70 69 6c  oid){.  ReCompil
5980: 65 64 20 2a 70 52 65 3b 0a 20 20 63 6f 6e 73 74  ed *pRe;.  const
5990: 20 63 68 61 72 20 2a 7a 45 72 72 3b 0a 20 20 69   char *zErr;.  i
59a0: 6e 74 20 69 67 6e 6f 72 65 43 61 73 65 20 3d 20  nt ignoreCase = 
59b0: 66 69 6e 64 5f 6f 70 74 69 6f 6e 28 22 69 67 6e  find_option("ign
59c0: 6f 72 65 2d 63 61 73 65 22 2c 22 69 22 2c 30 29  ore-case","i",0)
59d0: 21 3d 30 3b 0a 20 20 69 66 28 20 67 2e 61 72 67  !=0;.  if( g.arg
59e0: 63 3c 33 20 29 7b 0a 20 20 20 20 75 73 61 67 65  c<3 ){.    usage
59f0: 28 22 52 45 47 45 58 50 20 5b 46 49 4c 45 2e 2e  ("REGEXP [FILE..
5a00: 2e 5d 22 29 3b 0a 20 20 7d 0a 20 20 7a 45 72 72  .]");.  }.  zErr
5a10: 20 3d 20 72 65 5f 63 6f 6d 70 69 6c 65 28 26 70   = re_compile(&p
5a20: 52 65 2c 20 67 2e 61 72 67 76 5b 32 5d 2c 20 69  Re, g.argv[2], i
5a30: 67 6e 6f 72 65 43 61 73 65 29 3b 0a 20 20 69 66  gnoreCase);.  if
5a40: 28 20 7a 45 72 72 20 29 20 66 6f 73 73 69 6c 5f  ( zErr ) fossil_
5a50: 66 61 74 61 6c 28 22 25 73 22 2c 20 7a 45 72 72  fatal("%s", zErr
5a60: 29 3b 0a 20 20 69 66 28 20 67 2e 61 72 67 63 3d  );.  if( g.argc=
5a70: 3d 33 20 29 7b 0a 20 20 20 20 67 72 65 70 5f 66  =3 ){.    grep_f
5a80: 69 6c 65 28 70 52 65 2c 20 22 2d 22 2c 20 73 74  ile(pRe, "-", st
5a90: 64 69 6e 29 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20  din);.  }else{. 
5aa0: 20 20 20 69 6e 74 20 69 3b 0a 20 20 20 20 66 6f     int i;.    fo
5ab0: 72 28 69 3d 33 3b 20 69 3c 67 2e 61 72 67 63 3b  r(i=3; i<g.argc;
5ac0: 20 69 2b 2b 29 7b 0a 20 20 20 20 20 20 46 49 4c   i++){.      FIL
5ad0: 45 20 2a 69 6e 20 3d 20 66 6f 73 73 69 6c 5f 66  E *in = fossil_f
5ae0: 6f 70 65 6e 28 67 2e 61 72 67 76 5b 69 5d 2c 20  open(g.argv[i], 
5af0: 22 72 62 22 29 3b 0a 20 20 20 20 20 20 69 66 28  "rb");.      if(
5b00: 20 69 6e 3d 3d 30 20 29 7b 0a 20 20 20 20 20 20   in==0 ){.      
5b10: 20 20 66 6f 73 73 69 6c 5f 77 61 72 6e 69 6e 67    fossil_warning
5b20: 28 22 63 61 6e 6e 6f 74 20 6f 70 65 6e 20 5c 22  ("cannot open \"
5b30: 25 73 5c 22 22 2c 20 67 2e 61 72 67 76 5b 69 5d  %s\"", g.argv[i]
5b40: 29 3b 0a 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a  );.      }else{.
5b50: 20 20 20 20 20 20 20 20 67 72 65 70 5f 66 69 6c          grep_fil
5b60: 65 28 70 52 65 2c 20 67 2e 61 72 67 76 5b 69 5d  e(pRe, g.argv[i]
5b70: 2c 20 69 6e 29 3b 0a 20 20 20 20 20 20 20 20 66  , in);.        f
5b80: 63 6c 6f 73 65 28 69 6e 29 3b 0a 20 20 20 20 20  close(in);.     
5b90: 20 7d 0a 20 20 20 20 7d 0a 20 20 7d 0a 20 20 72   }.    }.  }.  r
5ba0: 65 5f 66 72 65 65 28 70 52 65 29 3b 0a 7d 0a 0a  e_free(pRe);.}..
5bb0: 2f 2a 0a 2a 2a 20 43 4f 4d 4d 41 4e 44 3a 20 67  /*.** COMMAND: g
5bc0: 72 65 70 0a 2a 2a 0a 2a 2a 20 55 73 61 67 65 3a  rep.**.** Usage:
5bd0: 20 25 66 6f 73 73 69 6c 20 67 72 65 70 20 5b 4f   %fossil grep [O
5be0: 50 54 49 4f 4e 53 5d 20 50 41 54 54 45 52 4e 20  PTIONS] PATTERN 
5bf0: 46 49 4c 45 4e 41 4d 45 0a 2a 2a 0a 2a 2a 20 41  FILENAME.**.** A
5c00: 74 74 65 6d 70 74 20 74 6f 20 6d 61 74 63 68 20  ttempt to match 
5c10: 74 68 65 20 67 69 76 65 6e 20 50 4f 53 49 58 20  the given POSIX 
5c20: 65 78 74 65 6e 64 65 64 20 72 65 67 75 6c 61 72  extended regular
5c30: 20 65 78 70 72 65 73 73 69 6f 6e 20 50 41 54 54   expression PATT
5c40: 45 52 4e 0a 2a 2a 20 6f 76 65 72 20 61 6c 6c 20  ERN.** over all 
5c50: 68 69 73 74 6f 72 69 63 20 76 65 72 73 69 6f 6e  historic version
5c60: 73 20 6f 66 20 46 49 4c 45 4e 41 4d 45 2e 20 20  s of FILENAME.  
5c70: 46 6f 72 20 64 65 74 61 69 6c 73 20 6f 66 20 74  For details of t
5c80: 68 65 20 73 75 70 70 6f 72 74 65 64 0a 2a 2a 20  he supported.** 
5c90: 52 45 20 64 69 61 6c 65 63 74 2c 20 73 65 65 20  RE dialect, see 
5ca0: 68 74 74 70 73 3a 2f 2f 66 6f 73 73 69 6c 2d 73  https://fossil-s
5cb0: 63 6d 2e 6f 72 67 2f 66 6f 73 73 69 6c 2f 64 6f  cm.org/fossil/do
5cc0: 63 2f 74 72 75 6e 6b 2f 77 77 77 2f 67 72 65 70  c/trunk/www/grep
5cd0: 2e 6d 64 0a 2a 2a 0a 2a 2a 20 4f 70 74 69 6f 6e  .md.**.** Option
5ce0: 73 3a 0a 2a 2a 0a 2a 2a 20 20 20 20 20 2d 69 7c  s:.**.**     -i|
5cf0: 2d 2d 69 67 6e 6f 72 65 2d 63 61 73 65 20 20 20  --ignore-case   
5d00: 20 20 20 20 20 20 49 67 6e 6f 72 65 20 63 61 73        Ignore cas
5d10: 65 0a 2a 2a 20 20 20 20 20 2d 6c 7c 2d 2d 66 69  e.**     -l|--fi
5d20: 6c 65 73 2d 77 69 74 68 2d 6d 61 74 63 68 65 73  les-with-matches
5d30: 20 20 4c 69 73 74 20 6f 6e 6c 79 20 63 68 65 63    List only chec
5d40: 6b 69 6e 20 49 44 20 66 6f 72 20 76 65 72 73 69  kin ID for versi
5d50: 6f 6e 73 20 74 68 61 74 20 6d 61 74 63 68 0a 2a  ons that match.*
5d60: 2a 20 20 20 20 20 2d 76 7c 2d 2d 76 65 72 62 6f  *     -v|--verbo
5d70: 73 65 20 20 20 20 20 20 20 20 20 20 20 20 20 53  se             S
5d80: 68 6f 77 20 65 61 63 68 20 66 69 6c 65 20 61 73  how each file as
5d90: 20 69 74 20 69 73 20 61 6e 61 6c 79 7a 65 64 0a   it is analyzed.
5da0: 2a 2f 0a 76 6f 69 64 20 72 65 5f 67 72 65 70 5f  */.void re_grep_
5db0: 63 6d 64 28 76 6f 69 64 29 7b 0a 20 20 75 33 32  cmd(void){.  u32
5dc0: 20 66 6c 61 67 73 20 3d 20 30 3b 0a 20 20 69 6e   flags = 0;.  in
5dd0: 74 20 62 56 65 72 62 6f 73 65 20 3d 20 30 3b 0a  t bVerbose = 0;.
5de0: 20 20 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70 52    ReCompiled *pR
5df0: 65 3b 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20  e;.  const char 
5e00: 2a 7a 45 72 72 3b 0a 20 20 69 6e 74 20 69 67 6e  *zErr;.  int ign
5e10: 6f 72 65 43 61 73 65 20 3d 20 30 3b 0a 20 20 42  oreCase = 0;.  B
5e20: 6c 6f 62 20 66 75 6c 6c 4e 61 6d 65 3b 0a 0a 20  lob fullName;.. 
5e30: 20 69 66 28 20 66 69 6e 64 5f 6f 70 74 69 6f 6e   if( find_option
5e40: 28 22 69 67 6e 6f 72 65 2d 63 61 73 65 22 2c 22  ("ignore-case","
5e50: 69 22 2c 30 29 21 3d 30 20 29 20 69 67 6e 6f 72  i",0)!=0 ) ignor
5e60: 65 43 61 73 65 20 3d 20 31 3b 0a 20 20 69 66 28  eCase = 1;.  if(
5e70: 20 66 69 6e 64 5f 6f 70 74 69 6f 6e 28 22 66 69   find_option("fi
5e80: 6c 65 73 2d 77 69 74 68 2d 6d 61 74 63 68 65 73  les-with-matches
5e90: 22 2c 22 6c 22 2c 30 29 21 3d 30 20 29 20 66 6c  ","l",0)!=0 ) fl
5ea0: 61 67 73 20 7c 3d 20 47 52 45 50 5f 45 58 49 53  ags |= GREP_EXIS
5eb0: 54 53 3b 0a 20 20 69 66 28 20 66 69 6e 64 5f 6f  TS;.  if( find_o
5ec0: 70 74 69 6f 6e 28 22 76 65 72 62 6f 73 65 22 2c  ption("verbose",
5ed0: 22 76 22 2c 30 29 21 3d 30 20 29 20 62 56 65 72  "v",0)!=0 ) bVer
5ee0: 62 6f 73 65 20 3d 20 31 3b 0a 20 20 64 62 5f 66  bose = 1;.  db_f
5ef0: 69 6e 64 5f 61 6e 64 5f 6f 70 65 6e 5f 72 65 70  ind_and_open_rep
5f00: 6f 73 69 74 6f 72 79 28 30 2c 20 30 29 3b 0a 20  ository(0, 0);. 
5f10: 20 76 65 72 69 66 79 5f 61 6c 6c 5f 6f 70 74 69   verify_all_opti
5f20: 6f 6e 73 28 29 3b 0a 20 20 69 66 28 20 67 2e 61  ons();.  if( g.a
5f30: 72 67 63 3c 34 20 29 7b 0a 20 20 20 20 75 73 61  rgc<4 ){.    usa
5f40: 67 65 28 22 52 45 47 45 58 50 20 46 49 4c 45 4e  ge("REGEXP FILEN
5f50: 41 4d 45 22 29 3b 0a 20 20 7d 0a 20 20 7a 45 72  AME");.  }.  zEr
5f60: 72 20 3d 20 72 65 5f 63 6f 6d 70 69 6c 65 28 26  r = re_compile(&
5f70: 70 52 65 2c 20 67 2e 61 72 67 76 5b 32 5d 2c 20  pRe, g.argv[2], 
5f80: 69 67 6e 6f 72 65 43 61 73 65 29 3b 0a 20 20 69  ignoreCase);.  i
5f90: 66 28 20 7a 45 72 72 20 29 20 66 6f 73 73 69 6c  f( zErr ) fossil
5fa0: 5f 66 61 74 61 6c 28 22 25 73 22 2c 20 7a 45 72  _fatal("%s", zEr
5fb0: 72 29 3b 0a 0a 20 20 69 66 28 20 66 69 6c 65 5f  r);..  if( file_
5fc0: 74 72 65 65 5f 6e 61 6d 65 28 67 2e 61 72 67 76  tree_name(g.argv
5fd0: 5b 33 5d 2c 20 26 66 75 6c 6c 4e 61 6d 65 2c 20  [3], &fullName, 
5fe0: 30 2c 20 30 29 20 29 7b 0a 20 20 20 20 69 6e 74  0, 0) ){.    int
5ff0: 20 66 6e 69 64 20 3d 20 64 62 5f 69 6e 74 28 30   fnid = db_int(0
6000: 2c 20 22 53 45 4c 45 43 54 20 66 6e 69 64 20 46  , "SELECT fnid F
6010: 52 4f 4d 20 66 69 6c 65 6e 61 6d 65 20 57 48 45  ROM filename WHE
6020: 52 45 20 6e 61 6d 65 3d 25 51 22 2c 0a 20 20 20  RE name=%Q",.   
6030: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
6040: 20 20 20 62 6c 6f 62 5f 73 74 72 28 26 66 75 6c     blob_str(&ful
6050: 6c 4e 61 6d 65 29 29 3b 0a 20 20 20 20 69 66 28  lName));.    if(
6060: 20 66 6e 69 64 20 29 7b 0a 20 20 20 20 20 20 53   fnid ){.      S
6070: 74 6d 74 20 71 3b 0a 20 20 20 20 20 20 61 64 64  tmt q;.      add
6080: 5f 63 6f 6e 74 65 6e 74 5f 73 71 6c 5f 63 6f 6d  _content_sql_com
6090: 6d 61 6e 64 73 28 67 2e 64 62 29 3b 0a 20 20 20  mands(g.db);.   
60a0: 20 20 20 64 62 5f 70 72 65 70 61 72 65 28 26 71     db_prepare(&q
60b0: 2c 0a 20 20 20 20 20 20 20 20 22 53 45 4c 45 43  ,.        "SELEC
60c0: 54 20 63 6f 6e 74 65 6e 74 28 75 78 29 2c 20 73  T content(ux), s
60d0: 75 62 73 74 72 28 75 78 2c 31 2c 31 30 29 20 46  ubstr(ux,1,10) F
60e0: 52 4f 4d 20 28 22 0a 20 20 20 20 20 20 20 20 22  ROM (".        "
60f0: 20 20 53 45 4c 45 43 54 20 62 6c 6f 62 2e 75 75    SELECT blob.uu
6100: 69 64 20 41 53 20 75 78 2c 20 6d 69 6e 28 65 76  id AS ux, min(ev
6110: 65 6e 74 2e 6d 74 69 6d 65 29 20 41 53 20 6d 78  ent.mtime) AS mx
6120: 22 0a 20 20 20 20 20 20 20 20 22 20 20 20 20 46  ".        "    F
6130: 52 4f 4d 20 6d 6c 69 6e 6b 2c 20 62 6c 6f 62 2c  ROM mlink, blob,
6140: 20 65 76 65 6e 74 22 0a 20 20 20 20 20 20 20 20   event".        
6150: 22 20 20 20 57 48 45 52 45 20 6d 6c 69 6e 6b 2e  "   WHERE mlink.
6160: 6d 69 64 3d 65 76 65 6e 74 2e 6f 62 6a 69 64 22  mid=event.objid"
6170: 0a 20 20 20 20 20 20 20 20 22 20 20 20 20 20 41  .        "     A
6180: 4e 44 20 6d 6c 69 6e 6b 2e 66 69 64 3d 62 6c 6f  ND mlink.fid=blo
6190: 62 2e 72 69 64 22 0a 20 20 20 20 20 20 20 20 22  b.rid".        "
61a0: 20 20 20 20 20 41 4e 44 20 6d 6c 69 6e 6b 2e 66       AND mlink.f
61b0: 6e 69 64 3d 25 64 22 0a 20 20 20 20 20 20 20 20  nid=%d".        
61c0: 22 20 20 20 47 52 4f 55 50 20 42 59 20 62 6c 6f  "   GROUP BY blo
61d0: 62 2e 75 75 69 64 22 0a 20 20 20 20 20 20 20 20  b.uuid".        
61e0: 22 29 20 4f 52 44 45 52 20 42 59 20 6d 78 20 44  ") ORDER BY mx D
61f0: 45 53 43 3b 22 2c 0a 20 20 20 20 20 20 20 20 66  ESC;",.        f
6200: 6e 69 64 0a 20 20 20 20 20 20 29 3b 0a 20 20 20  nid.      );.   
6210: 20 20 20 77 68 69 6c 65 28 20 64 62 5f 73 74 65     while( db_ste
6220: 70 28 26 71 29 3d 3d 53 51 4c 49 54 45 5f 52 4f  p(&q)==SQLITE_RO
6230: 57 20 29 7b 0a 20 20 20 20 20 20 20 20 69 66 28  W ){.        if(
6240: 20 62 56 65 72 62 6f 73 65 20 29 20 66 6f 73 73   bVerbose ) foss
6250: 69 6c 5f 70 72 69 6e 74 28 22 25 73 3a 5c 6e 22  il_print("%s:\n"
6260: 2c 20 64 62 5f 63 6f 6c 75 6d 6e 5f 74 65 78 74  , db_column_text
6270: 28 26 71 2c 31 29 29 3b 0a 20 20 20 20 20 20 20  (&q,1));.       
6280: 20 67 72 65 70 5f 62 75 66 66 65 72 28 70 52 65   grep_buffer(pRe
6290: 2c 20 64 62 5f 63 6f 6c 75 6d 6e 5f 74 65 78 74  , db_column_text
62a0: 28 26 71 2c 31 29 2c 20 64 62 5f 63 6f 6c 75 6d  (&q,1), db_colum
62b0: 6e 5f 74 65 78 74 28 26 71 2c 30 29 2c 20 66 6c  n_text(&q,0), fl
62c0: 61 67 73 29 3b 0a 20 20 20 20 20 20 7d 0a 20 20  ags);.      }.  
62d0: 20 20 20 20 64 62 5f 66 69 6e 61 6c 69 7a 65 28      db_finalize(
62e0: 26 71 29 3b 0a 20 20 20 20 7d 0a 20 20 7d 0a 7d  &q);.    }.  }.}
62f0: 0a                                               .