dox/html/recgrs_8c_source.html

 /* This file is part of the Zebra server.

    Copyright (C) Index Data


 Zebra is free software; you can redistribute it and/or modify it under

 the terms of the GNU General Public License as published by the Free

 Software Foundation; either version 2, or (at your option) any later

 version.


 Zebra is distributed in the hope that it will be useful, but WITHOUT ANY

 WARRANTY; without even the implied warranty of MERCHANTABILITY or

 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License

 for more details.


 You should have received a copy of the GNU General Public License

 along with this program; if not, write to the Free Software

 Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA


 */


 #if HAVE_CONFIG_H

 #include <config.h>

 #endif

 #include <stdio.h>

 #include <assert.h>

 #include <sys/types.h>

 #include <ctype.h>


 #include <yaz/log.h>

 #include <yaz/oid_db.h>

 #include <yaz/diagbib1.h>

 #include <yaz/wrbuf.h>

 #include <yaz/snprintf.h>


 #include <d1_absyn.h>

 #include <idzebra/recgrs.h>


 #define GRS_MAX_WORD 512


 struct source_parser {

     int len;

     const char *tok;

     const char *src;

     int lookahead;

     NMEM nmem;

 };


 static int sp_lex(struct source_parser *sp)

 {

     while (*sp->src == ' ')

         (sp->src)++;

     sp->tok = sp->src;

     sp->len = 0;

     while (*sp->src && !strchr("<>();,-: ", *sp->src))

     {

         sp->src++;

         sp->len++;

     }

     if (sp->len)

         sp->lookahead = 't';

     else

     {

         sp->lookahead = *sp->src;

         if (*sp->src)

             sp->src++;

     }

     return sp->lookahead;

 }


 static int sp_expr(struct source_parser *sp, data1_node *n, RecWord *wrd);


 static int sp_range(struct source_parser *sp, data1_node *n, RecWord *wrd)

 {

     int start, len;

     RecWord tmp_w;


     /* ( */

     sp_lex(sp);

     if (sp->lookahead != '(')

         return 0;

     sp_lex(sp); /* skip ( */


     /* 1st arg: string */

     if (!sp_expr(sp, n, wrd))

         return 0;


     if (sp->lookahead != ',')

         return 0;

     sp_lex(sp); /* skip , */


     /* 2nd arg: start */

     if (!sp_expr(sp, n, &tmp_w))

         return 0;

     start = atoi_n(tmp_w.term_buf, tmp_w.term_len);


     if (sp->lookahead == ',')

     {

         sp_lex(sp); /* skip , */


         /* 3rd arg: length */

         if (!sp_expr(sp, n, &tmp_w))

             return 0;

         len = atoi_n(tmp_w.term_buf, tmp_w.term_len);

     }

     else

         len = wrd->term_len;


     /* ) */

     if (sp->lookahead != ')')

         return 0;

     sp_lex(sp);


     if (wrd->term_buf)

     {

         if (start >= wrd->term_len)

             wrd->term_len = 0;

         else

         {

             wrd->term_len -= start;

             wrd->term_buf += start;


             if (wrd->term_len > len)

                 wrd->term_len = len;

         }

     }

     return 1;

 }


 static int sp_first(struct source_parser *sp, data1_node *n, RecWord *wrd)

 {

     char num_str[20];

     int min_pos = -1;

     sp_lex(sp);

     if (sp->lookahead != '(')

         return 0;

     sp_lex(sp); /* skip ( */

     if (!sp_expr(sp, n, wrd))

         return 0;

     while (sp->lookahead == ',')

     {

         RecWord search_w;

         int i;

         sp_lex(sp); /* skip , */


         if (!sp_expr(sp, n, &search_w))

             return 0;

         for (i = 0; i<wrd->term_len; i++)

         {

             int j;

             for (j = 0; j<search_w.term_len && i+j < wrd->term_len; j++)

                 if (wrd->term_buf[i+j] != search_w.term_buf[j])

                     break;

             if (j == search_w.term_len) /* match ? */

             {

                 if (min_pos == -1 || i < min_pos)

                     min_pos = i;

                 break;

             }

         }

     }

     if (sp->lookahead != ')')

         return 0;

     sp_lex(sp);

     if (min_pos == -1)

         min_pos = 0;  /* the default if not found */

     yaz_snprintf(num_str, sizeof(num_str), "%d", min_pos);

     wrd->term_buf = nmem_strdup(sp->nmem, num_str);

     wrd->term_len = strlen(wrd->term_buf);

     return 1;

 }


 static int sp_expr(struct source_parser *sp, data1_node *n, RecWord *wrd)

 {

     if (sp->lookahead != 't')

         return 0;

     if (sp->len == 4 && !memcmp(sp->tok, "data", sp->len))

     {

         if (n->which == DATA1N_data)

         {

             wrd->term_buf = n->u.data.data;

             wrd->term_len = n->u.data.len;

         }

         sp_lex(sp);

     }

     else if (sp->len == 3 && !memcmp(sp->tok, "tag", sp->len))

     {

         if (n->which == DATA1N_tag)

         {

             wrd->term_buf = n->u.tag.tag;

             wrd->term_len = strlen(n->u.tag.tag);

         }

         sp_lex(sp);

     }

     else if (sp->len == 4 && !memcmp(sp->tok, "attr", sp->len))

     {

         RecWord tmp_w;

         sp_lex(sp);

         if (sp->lookahead != '(')

             return 0;

         sp_lex(sp);


         if (!sp_expr(sp, n, &tmp_w))

             return 0;


         wrd->term_buf = "";

         wrd->term_len = 0;

         if (n->which == DATA1N_tag)

         {

             data1_xattr *p = n->u.tag.attributes;

             while (p && strlen(p->name) != tmp_w.term_len &&

                    memcmp (p->name, tmp_w.term_buf, tmp_w.term_len))

                 p = p->next;

             if (p)

             {

                 wrd->term_buf = p->value;

                 wrd->term_len = strlen(p->value);

             }

         }

         if (sp->lookahead != ')')

             return 0;

         sp_lex(sp);

     }

     else if (sp->len == 5 && !memcmp(sp->tok, "first", sp->len))

     {

         return sp_first(sp, n, wrd);

     }

     else if (sp->len == 5 && !memcmp(sp->tok, "range", sp->len))

     {

         return sp_range(sp, n, wrd);

     }

     else if (sp->len > 0 && isdigit(*(unsigned char *)sp->tok))

     {

         char *b;

         wrd->term_len = sp->len;

         b = nmem_malloc(sp->nmem, sp->len);

         memcpy(b, sp->tok, sp->len);

         wrd->term_buf = b;

         sp_lex(sp);

     }

     else if (sp->len > 2 && sp->tok[0] == '\'' && sp->tok[sp->len-1] == '\'')

     {

         char *b;

         wrd->term_len = sp->len - 2;

         b = nmem_malloc(sp->nmem, wrd->term_len);

         memcpy(b, sp->tok+1, wrd->term_len);

         wrd->term_buf = b;

         sp_lex(sp);

     }

     else

     {

         wrd->term_buf = "";

         wrd->term_len = 0;

         sp_lex(sp);

     }

     return 1;

 }


 static struct source_parser *source_parser_create(void)

 {

     struct source_parser *sp = xmalloc(sizeof(*sp));


     sp->nmem = nmem_create();

     return sp;

 }


 static void source_parser_destroy(struct source_parser *sp)

 {

     if (!sp)

         return;

     nmem_destroy(sp->nmem);

     xfree(sp);

 }


 static int sp_parse(struct source_parser *sp,

                     data1_node *n, RecWord *wrd, const char *src)

 {

     sp->len = 0;

     sp->tok = 0;

     sp->src = src;

     sp->lookahead = 0;

     nmem_reset(sp->nmem);


     sp_lex(sp);

     return sp_expr(sp, n, wrd);

 }


 int d1_check_xpath_predicate(data1_node *n, struct xpath_predicate *p)

 {

     int res = 1;

     char *attname;

     data1_xattr *attr;


     if (!p) {

         return 1;

     } else {

         if (p->which == XPATH_PREDICATE_RELATION) {

             if (p->u.relation.name[0]) {

                 if (*p->u.relation.name != '@') {

                     yaz_log(YLOG_WARN,

                          "  Only attributes (@) are supported in xelm xpath predicates");

                     yaz_log(YLOG_WARN, "predicate %s ignored", p->u.relation.name);

                     return 1;

                 }

                 attname = p->u.relation.name + 1;

                 res = 0;

                 /* looking for the attribute with a specified name */

                 for (attr = n->u.tag.attributes; attr; attr = attr->next) {

                     if (!strcmp(attr->name, attname)) {

                         if (p->u.relation.op[0]) {

                             if (*p->u.relation.op != '=') {

                                 yaz_log(YLOG_WARN,

                                      "Only '=' relation is supported (%s)",p->u.relation.op);

                                 yaz_log(YLOG_WARN, "predicate %s ignored", p->u.relation.name);

                                 res = 1; break;

                             } else {

                                 if (!strcmp(attr->value, p->u.relation.value)) {

                                     res = 1; break;

                                 }

                             }

                         } else {

                             /* attribute exists, no value specified */

                             res = 1; break;

                         }

                     }

                 }

                 return res;

             } else {

                 return 1;

             }

         }

         else if (p->which == XPATH_PREDICATE_BOOLEAN) {

             if (!strcmp(p->u.boolean.op,"and")) {

                 return d1_check_xpath_predicate(n, p->u.boolean.left)

                     && d1_check_xpath_predicate(n, p->u.boolean.right);

             }

             else if (!strcmp(p->u.boolean.op,"or")) {

                 return (d1_check_xpath_predicate(n, p->u.boolean.left)

                         || d1_check_xpath_predicate(n, p->u.boolean.right));

             } else {

                 yaz_log(YLOG_WARN, "Unknown boolean relation %s, ignored",p->u.boolean.op);

                 return 1;

             }

         }

     }

     return 0;

 }


 static int dfa_match_first(struct DFA_state **dfaar, const char *text)

 {

     struct DFA_state *s = dfaar[0]; /* start state */

     struct DFA_tran *t;

     int i;

     const char *p = text;

     unsigned char c;


     for (c = *p++, t = s->trans, i = s->tran_no; --i >= 0; t++)

     {

         if (c >= t->ch[0] && c <= t->ch[1])

         {

             while (i >= 0)

             {

                 /* move to next state and return if we get a match */

                 s = dfaar[t->to];

                 if (s->rule_no)

                     return 1;

                 /* next char */

                 if (!c)

                     return 0;

                 c = *p++;

                 for (t = s->trans, i = s->tran_no; --i >= 0; t++)

                     if (c >= t->ch[0] && c <= t->ch[1])

                         break;

             }

         }

     }

     return 0;

 }


 /* *ostrich*


 New function, looking for xpath "element" definitions in abs, by

 tagpath, using a kind of ugly regxp search.The DFA was built while

 parsing abs, so here we just go trough them and try to match

 against the given tagpath. The first matching entry is returned.


 pop, 2002-12-13


 Added support for enhanced xelm. Now [] predicates are considered

 as well, when selecting indexing rules... (why the hell it's called

 termlist???)


 pop, 2003-01-17


 */


 data1_termlist *xpath_termlist_by_tagpath(char *tagpath, data1_node *n)

 {

     data1_absyn *abs = n->root->u.root.absyn;


     data1_xpelement *xpe = 0;

     data1_node *nn;

 #ifdef ENHANCED_XELM

     struct xpath_location_step *xp;

 #endif

     WRBUF pexpr = wrbuf_alloc();


     wrbuf_printf(pexpr, "/%s\n", tagpath);


     for (xpe = abs->xp_elements; xpe; xpe = xpe->next)

         xpe->match_state = -1; /* don't know if it matches yet */


     for (xpe = abs->xp_elements; xpe; xpe = xpe->next)

     {

         int i;

         int ok = xpe->match_state;

         if (ok == -1)

         {   /* don't know whether there is a match yet */

             data1_xpelement *xpe1;


             assert(xpe->dfa);

             ok = dfa_match_first(xpe->dfa->states, wrbuf_cstr(pexpr));


 #if OPTIMIZE_MELM

             /* mark this and following ones with same regexp */

             for (xpe1 = xpe; xpe1; xpe1 = xpe1->match_next)

                 xpe1->match_state = ok;

 #endif

         }

         assert(ok == 0 || ok == 1);

         if (ok) {

 #ifdef ENHANCED_XELM

             /* we have to check the perdicates up to the root node */

             xp = xpe->xpath;


             /* find the first tag up in the node structure */

             for (nn = n; nn && nn->which != DATA1N_tag; nn = nn->parent)

                 ;


             /* go from inside out in the node structure, while going

                backwards trough xpath location steps ... */

             for (i = xpe->xpath_len - 1; i>0; i--)

             {

                 if (!d1_check_xpath_predicate(nn, xp[i].predicate))

                 {

                     ok = 0;

                     break;

                 }


                 if (nn->which == DATA1N_tag)

                     nn = nn->parent;

             }

 #endif

             if (ok)

                 break;

         }

     }


     wrbuf_destroy(pexpr);


     if (xpe)

         return xpe->termlists;

     else

         return NULL;

 }


 /* use

      1   start element (tag)

      2   end element

      3   start attr (and attr-exact)

      4   end attr


   1016   cdata

   1015   attr data


   *ostrich*


   Now, if there is a matching xelm described in abs, for the

   indexed element or the attribute,  then the data is handled according

   to those definitions...


   modified by pop, 2002-12-13

 */


 /* add xpath index for an attribute */

 static void index_xpath_attr(char *tag_path, char *name, char *value,

                               char *structure, struct recExtractCtrl *p,

                               RecWord *wrd)

 {

     wrd->index_name = ZEBRA_XPATH_ELM_BEGIN;

     wrd->index_type = "0";

     wrd->term_buf = tag_path;

     wrd->term_len = strlen(tag_path);

     (*p->tokenAdd)(wrd);


     if (value) {

         wrd->index_name = ZEBRA_XPATH_ATTR_CDATA;

         wrd->index_type = "w";

         wrd->term_buf = value;

         wrd->term_len = strlen(value);

         (*p->tokenAdd)(wrd);

     }

     wrd->index_name = ZEBRA_XPATH_ELM_END;

     wrd->index_type = "0";

     wrd->term_buf = tag_path;

     wrd->term_len = strlen(tag_path);

     (*p->tokenAdd)(wrd);

 }


 static void mk_tag_path_full(char *tag_path_full, size_t max, data1_node *n)

 {

     size_t flen = 0;

     data1_node *nn;


     /* we have to fetch the whole path to the data tag */

     for (nn = n; nn; nn = nn->parent)

     {

         if (nn->which == DATA1N_tag)

         {

             size_t tlen = strlen(nn->u.tag.tag);

             if (tlen + flen > (max - 2))

                 break;

             memcpy(tag_path_full + flen, nn->u.tag.tag, tlen);

             flen += tlen;

             tag_path_full[flen++] = '/';

         }

         else

             if (nn->which == DATA1N_root)

                 break;

     }

     tag_path_full[flen] = 0;

 }


 static void index_xpath(struct source_parser *sp, data1_node *n,

                         struct recExtractCtrl *p,

                         int level, RecWord *wrd,

                         char *xpath_index,

                         int xpath_is_start

     )

 {

     int i;

     char tag_path_full[1024];

     int termlist_only = 1;

     data1_termlist *tl;


     if (!n->root->u.root.absyn

         ||

         n->root->u.root.absyn->xpath_indexing == DATA1_XPATH_INDEXING_ENABLE)

     {

         termlist_only = 0;

     }


     switch (n->which)

     {

     case DATA1N_data:

         wrd->term_buf = n->u.data.data;

         wrd->term_len = n->u.data.len;


         mk_tag_path_full(tag_path_full, sizeof(tag_path_full), n);


         /* If we have a matching termlist... */

         if (n->root->u.root.absyn &&

             (tl = xpath_termlist_by_tagpath(tag_path_full, n)))

         {

             zint max_seqno = 0;

             for (; tl; tl = tl->next)

             {

                 /* need to copy recword because it may be changed */

                 RecWord wrd_tl;

                 wrd->index_type = tl->structure;

                 memcpy(&wrd_tl, wrd, sizeof(*wrd));

                 if (tl->source)

                     sp_parse(sp, n, &wrd_tl, tl->source);


                 /* this is just the old fashioned attribute based index */

                 wrd_tl.index_name = tl->index_name;

                 if (p->flagShowRecords)

                 {

                     int i;

                     printf("%*sIdx: [%s]", (level + 1) * 4, "",

                            tl->structure);

                     printf("%s %s", tl->index_name, tl->source);

                     printf(" XData:\"");

                     for (i = 0; i<wrd_tl.term_len && i < 40; i++)

                         fputc(wrd_tl.term_buf[i], stdout);

                     fputc('"', stdout);

                     if (wrd_tl.term_len > 40)

                         printf(" ...");

                     fputc('\n', stdout);

                 }

                 else

                 {

                     (*p->tokenAdd)(&wrd_tl);

                 }

                 if (wrd_tl.seqno > max_seqno)

                     max_seqno = wrd_tl.seqno;

             }

             if (max_seqno)

                 wrd->seqno = max_seqno;


         }

         /* xpath indexing is done, if there was no termlist given,

            or no ! in the termlist, and default indexing is enabled... */

         if (!p->flagShowRecords && !termlist_only)

         {

             wrd->index_name = xpath_index;

             wrd->index_type = "w";

             (*p->tokenAdd)(wrd);

         }

         break;

     case DATA1N_tag:

         mk_tag_path_full(tag_path_full, sizeof(tag_path_full), n);


         wrd->index_type = "0";

         wrd->term_buf = tag_path_full;

         wrd->term_len = strlen(tag_path_full);

         wrd->index_name = xpath_index;

         if (p->flagShowRecords)

         {

             printf("%*s tag=", (level + 1) * 4, "");

             for (i = 0; i<wrd->term_len && i < 40; i++)

                 fputc(wrd->term_buf[i], stdout);

             if (i == 40)

                 printf(" ..");

             printf("\n");

         }

         else

         {

             data1_xattr *xp;


             if (!termlist_only)

                 (*p->tokenAdd)(wrd);   /* index element pag (AKA tag path) */


             if (xpath_is_start == 1) /* only for the starting tag... */

             {

 #define MAX_ATTR_COUNT 50

                 data1_termlist *tll[MAX_ATTR_COUNT];


                 int i = 0;

                 for (xp = n->u.tag.attributes; xp; xp = xp->next) {

                     char comb[512];

                     char attr_tag_path_full[1026];


                     /* this could be cached as well */

                     yaz_snprintf(attr_tag_path_full, sizeof(attr_tag_path_full),

                         "@%s/%s", xp->name, tag_path_full);


                     tll[i] = xpath_termlist_by_tagpath(attr_tag_path_full,n);


                     if (!termlist_only)

                     {

                         /* attribute  (no value) */

                         wrd->index_type = "0";

                         wrd->index_name = ZEBRA_XPATH_ATTR_NAME;

                         wrd->term_buf = xp->name;

                         wrd->term_len = strlen(xp->name);


                         wrd->seqno--;

                         (*p->tokenAdd)(wrd);


                         if (xp->value

                             &&

                             strlen(xp->name) + strlen(xp->value) < sizeof(comb)-2)

                         {

                             /* attribute value exact */

                             strcpy(comb, xp->name);

                             strcat(comb, "=");

                             strcat(comb, xp->value);


                             wrd->index_name = ZEBRA_XPATH_ATTR_NAME;

                             wrd->index_type = "0";

                             wrd->term_buf = comb;

                             wrd->term_len = strlen(comb);

                             wrd->seqno--;


                             (*p->tokenAdd)(wrd);

                         }

                     }

                     i++;

                 }


                 i = 0;

                 for (xp = n->u.tag.attributes; xp; xp = xp->next) {

                     data1_termlist *tl;

                     char attr_tag_path_full[1026];

                     int xpdone = 0;


                     yaz_snprintf(attr_tag_path_full, sizeof(attr_tag_path_full),

                         "@%s/%s", xp->name, tag_path_full);

                     if ((tl = tll[i]))

                     {

                         /* If there is a termlist given (=xelm directive) */

                         for (; tl; tl = tl->next)

                         {

                             if (!tl->index_name)

                             {

                                 /* add xpath index for the attribute */

                                 index_xpath_attr(attr_tag_path_full, xp->name,

                                                   xp->value, tl->structure,

                                                   p, wrd);

                                 xpdone = 1;

                             } else {

                                 /* index attribute value (only path/@attr) */

                                 if (xp->value)

                                 {

                                     wrd->index_name = tl->index_name;

                                     wrd->index_type = tl->structure;

                                     wrd->term_buf = xp->value;

                                     wrd->term_len = strlen(xp->value);

                                     (*p->tokenAdd)(wrd);

                                 }

                             }

                         }

                     }

                     /* if there was no termlist for the given path,

                        or the termlist didn't have a ! element, index

                        the attribute as "w" */

                     if (!xpdone && !termlist_only)

                     {

                         index_xpath_attr(attr_tag_path_full, xp->name,

                                           xp->value,  "w", p, wrd);

                     }

                     i++;

                 }

             }

         }

     }

 }


 static void index_termlist(struct source_parser *sp, data1_node *par,

                             data1_node *n,

                             struct recExtractCtrl *p, int level, RecWord *wrd)

 {

     data1_termlist *tlist = 0;

     /*

      * cycle up towards the root until we find a tag with an att..

      * this has the effect of indexing locally defined tags with

      * the attribute of their ancestor in the record.

      */


     while (!par->u.tag.element)

         if (!par->parent || !(par=get_parent_tag(p->dh, par->parent)))

             break;

     if (!par || !(tlist = par->u.tag.element->termlists))

         return;

     for (; tlist; tlist = tlist->next)

     {

         /* consider source */

         wrd->term_buf = 0;

         assert(tlist->source);

         sp_parse(sp, n, wrd, tlist->source);


         if (wrd->term_buf && wrd->term_len)

         {

             if (p->flagShowRecords)

             {

                 int i;

                 printf("%*sIdx: [%s]", (level + 1) * 4, "",

                        tlist->structure);

                 printf("%s %s", tlist->index_name, tlist->source);

                 printf(" XData:\"");

                 for (i = 0; i<wrd->term_len && i < 40; i++)

                     fputc(wrd->term_buf[i], stdout);

                 fputc('"', stdout);

                 if (wrd->term_len > 40)

                     printf(" ...");

                 fputc('\n', stdout);

             }

             else

             {

                 wrd->index_type = tlist->structure;

                 wrd->index_name = tlist->index_name;

                 (*p->tokenAdd)(wrd);

             }

         }

     }

 }


 static int dumpkeys_r(struct source_parser *sp,

                       data1_node *n, struct recExtractCtrl *p, int level,

                       RecWord *wrd)

 {

     for (; n; n = n->next)

     {

         if (p->flagShowRecords) /* display element description to user */

         {

             if (n->which == DATA1N_root)

             {

                 printf("%*s", level * 4, "");

                 printf("Record type: '%s'\n", n->u.root.type);

             }

             else if (n->which == DATA1N_tag)

             {

                 data1_element *e;


                 printf("%*s", level * 4, "");

                 if (!(e = n->u.tag.element))

                     printf("Local tag: '%s'\n", n->u.tag.tag);

                 else

                 {

                     printf("Elm: '%s' ", e->name);

                     if (e->tag)

                     {

                         data1_tag *t = e->tag;


                         printf("TagNam: '%s' ", t->names->name);

                         printf("(");

                         if (t->tagset)

                             printf("%s[%d],", t->tagset->name, t->tagset->type);

                         else

                             printf("?,");

                         if (t->which == DATA1T_numeric)

                             printf("%d)", t->value.numeric);

                         else

                             printf("'%s')", t->value.string);

                     }

                     printf("\n");

                 }

             }

         }


         if (n->which == DATA1N_tag)

         {

             index_termlist(sp, n, n, p, level, wrd);

             /* index start tag */

             if (n->root->u.root.absyn)

                 index_xpath(sp, n, p, level, wrd, ZEBRA_XPATH_ELM_BEGIN,

                             1 /* is start */);

         }


         if (n->child)

             if (dumpkeys_r(sp, n->child, p, level + 1, wrd) < 0)

                 return -1;


         if (n->which == DATA1N_data)

         {

             data1_node *par = get_parent_tag(p->dh, n);


             if (p->flagShowRecords)

             {

                 printf("%*s", level * 4, "");

                 printf("Data: ");

                 if (n->u.data.len > 256)

                     printf("'%.170s ... %.70s'\n", n->u.data.data,

                            n->u.data.data + n->u.data.len-70);

                 else if (n->u.data.len > 0)

                     printf("'%.*s'\n", n->u.data.len, n->u.data.data);

                 else

                     printf("NULL\n");

             }


             if (par)

                 index_termlist(sp, par, n, p, level, wrd);


             index_xpath(sp, n, p, level, wrd, ZEBRA_XPATH_CDATA,

                         0 /* is start */);

         }


         if (n->which == DATA1N_tag)

         {

             /* index end tag */

             index_xpath(sp, n, p, level, wrd, ZEBRA_XPATH_ELM_END,

                         0 /* is start */);

         }


         if (p->flagShowRecords && n->which == DATA1N_root)

         {

             printf("%*s-------------\n\n", level * 4, "");

         }

     }

     return 0;

 }


 static int dumpkeys(data1_node *n, struct recExtractCtrl *p, RecWord *wrd)

 {

     struct source_parser *sp = source_parser_create();

     int r = dumpkeys_r(sp, n, p, 0, wrd);

     source_parser_destroy(sp);

     return r;

 }


 int grs_extract_tree(struct recExtractCtrl *p, data1_node *n)

 {

     RecWord wrd;


     if (n->u.root.absyn && n->u.root.absyn->oid)

         (*p->schemaAdd)(p, n->u.root.absyn->oid);

     (*p->init)(p, &wrd);


     /* data1_pr_tree(p->dh, n, stdout); */


     return dumpkeys(n, p, &wrd);

 }


 static int grs_extract_sub(void *clientData, struct recExtractCtrl *p,

                            NMEM mem,

                            data1_node *(*grs_read)(struct grs_read_info *))

 {

     data1_node *n;

     struct grs_read_info gri;

     RecWord wrd;


     gri.stream = p->stream;

     gri.mem = mem;

     gri.dh = p->dh;

     gri.clientData = clientData;


     n = (*grs_read)(&gri);

     if (!n)

         return RECCTRL_EXTRACT_EOF;

     if (n->u.root.absyn && n->u.root.absyn->oid)

         (*p->schemaAdd)(p, n->u.root.absyn->oid);

     data1_concat_text(p->dh, mem, n);


     /* ensure our data1 tree is UTF-8 */

     data1_iconv(p->dh, mem, n, "UTF-8", data1_get_encoding(p->dh, n));


     data1_remove_idzebra_subtree(p->dh, n);


 #if 0

     data1_pr_tree(p->dh, n, stdout);

 #endif


     (*p->init)(p, &wrd);

     if (dumpkeys(n, p, &wrd) < 0)

     {

         return RECCTRL_EXTRACT_ERROR_GENERIC;

     }

     return RECCTRL_EXTRACT_OK;

 }


 int zebra_grs_extract(void *clientData, struct recExtractCtrl *p,

                       data1_node *(*grs_read)(struct grs_read_info *))

 {

     int ret;

     NMEM mem = nmem_create();

     ret = grs_extract_sub(clientData, p, mem, grs_read);

     nmem_destroy(mem);

     return ret;

 }


 /*

  * Return: -1: Nothing done. 0: Ok. >0: Bib-1 diagnostic.

  */

 static int process_comp(data1_handle dh, data1_node *n, Z_RecordComposition *c,

                         char **addinfo, ODR o)

 {

     data1_esetname *eset;

     Z_Espec1 *espec = 0;

     Z_ElementSpec *p;


     switch (c->which)

     {

     case Z_RecordComp_simple:

         if (c->u.simple->which != Z_ElementSetNames_generic)

             return 26; /* only generic form supported. Fix this later */

         if (!(eset = data1_getesetbyname(dh, n->u.root.absyn,

                                          c->u.simple->u.generic)))

         {

             yaz_log(YLOG_LOG, "Unknown esetname '%s'", c->u.simple->u.generic);

             *addinfo = odr_strdup(o, c->u.simple->u.generic);

             return 25; /* invalid esetname */

         }

         yaz_log(YLOG_DEBUG, "Esetname '%s' in simple compspec",

              c->u.simple->u.generic);

         espec = eset->spec;

         break;

     case Z_RecordComp_complex:

         if (c->u.complex->generic)

         {

             /* insert check for schema */

             if ((p = c->u.complex->generic->elementSpec))

             {

                 switch (p->which)

                 {

                 case Z_ElementSpec_elementSetName:

                     if (!(eset =

                           data1_getesetbyname(dh, n->u.root.absyn,

                                               p->u.elementSetName)))

                     {

                         yaz_log(YLOG_DEBUG, "Unknown esetname '%s'",

                              p->u.elementSetName);

                         *addinfo = odr_strdup(o, p->u.elementSetName);

                         return 25; /* invalid esetname */

                     }

                     yaz_log(YLOG_DEBUG, "Esetname '%s' in complex compspec",

                          p->u.elementSetName);

                     espec = eset->spec;

                     break;

                 case Z_ElementSpec_externalSpec:

                     if (p->u.externalSpec->which == Z_External_espec1)

                     {

                         yaz_log(YLOG_DEBUG, "Got Espec-1");

                         espec = p->u.externalSpec-> u.espec1;

                     }

                     else

                     {

                         yaz_log(YLOG_LOG, "Unknown external espec.");

                         return 25; /* bad. what is proper diagnostic? */

                     }

                     break;

                 }

             }

         }

         else

             return 26; /* fix */

     }

     if (espec)

     {

         yaz_log(YLOG_DEBUG, "Element: Espec-1 match");

         return data1_doespec1(dh, n, espec);

     }

     else

     {

         yaz_log(YLOG_DEBUG, "Element: all match");

         return -1;

     }

 }


 /* Add Zebra info in separate namespace ...

         <root

          ...

          <metadata xmlns="http://www.indexdata.dk/zebra/">

           <size>359</size>

           <localnumber>447</localnumber>

           <filename>records/genera.xml</filename>

          </metadata>

         </root>

 */


 static void zebra_xml_metadata(struct recRetrieveCtrl *p, data1_node *top,

                                 NMEM mem)

 {

     const char *idzebra_ns[3];

     const char *i2 = "\n  ";

     const char *i4 = "\n    ";

     data1_node *n;


     idzebra_ns[0] = "xmlns";

     idzebra_ns[1] = "http://www.indexdata.dk/zebra/";

     idzebra_ns[2] = 0;


     data1_mk_text(p->dh, mem, i2, top);


     n = data1_mk_tag(p->dh, mem, "idzebra", idzebra_ns, top);


     data1_mk_text(p->dh, mem, "\n", top);


     data1_mk_text(p->dh, mem, i4, n);


     data1_mk_tag_data_int(p->dh, n, "size", p->recordSize, mem);


     if (p->score != -1)

     {

         data1_mk_text(p->dh, mem, i4, n);

         data1_mk_tag_data_int(p->dh, n, "score", p->score, mem);

     }

     data1_mk_text(p->dh, mem, i4, n);

     data1_mk_tag_data_zint(p->dh, n, "localnumber", p->localno, mem);

     if (p->fname)

     {

         data1_mk_text(p->dh, mem, i4, n);

         data1_mk_tag_data_text(p->dh, n, "filename", p->fname, mem);

     }

     data1_mk_text(p->dh, mem, i2, n);

 }


 int zebra_grs_retrieve(void *clientData, struct recRetrieveCtrl *p,

                        data1_node *(*grs_read)(struct grs_read_info *))

 {

     data1_node *node = 0, *onode = 0, *top;

     data1_node *dnew;

     data1_maptab *map;

     int res, selected = 0;

     NMEM mem;

     struct grs_read_info gri;

     const char *tagname;


     const Odr_oid *requested_schema = 0;

     data1_marctab *marctab;

     int dummy;


     mem = nmem_create();

     gri.stream = p->stream;

     gri.mem = mem;

     gri.dh = p->dh;

     gri.clientData = clientData;


     yaz_log(YLOG_DEBUG, "grs_retrieve");

     node = (*grs_read)(&gri);

     if (!node)

     {

         p->diagnostic = YAZ_BIB1_SYSTEM_ERROR_IN_PRESENTING_RECORDS;

         nmem_destroy(mem);

         return 0;

     }

     data1_concat_text(p->dh, mem, node);


     data1_remove_idzebra_subtree(p->dh, node);


 #if 0

     data1_pr_tree(p->dh, node, stdout);

 #endif

     top = data1_get_root_tag(p->dh, node);


     yaz_log(YLOG_DEBUG, "grs_retrieve: size");

     tagname = data1_systag_lookup(node->u.root.absyn, "size", "size");

     if (tagname &&

         (dnew = data1_mk_tag_data_wd(p->dh, top, tagname, mem)))

     {

         data1_set_data_zint(p->dh, dnew, mem, p->recordSize);

     }


     tagname = data1_systag_lookup(node->u.root.absyn, "rank", "rank");

     if (tagname && p->score >= 0 &&

         (dnew = data1_mk_tag_data_wd(p->dh, top, tagname, mem)))

     {

         yaz_log(YLOG_DEBUG, "grs_retrieve: %s", tagname);

         data1_set_data_zint(p->dh, dnew, mem, p->score);

     }


     tagname = data1_systag_lookup(node->u.root.absyn, "sysno",

                                   "localControlNumber");

     if (tagname && p->localno > 0 &&

         (dnew = data1_mk_tag_data_wd(p->dh, top, tagname, mem)))

     {

         yaz_log(YLOG_DEBUG, "grs_retrieve: %s", tagname);

         data1_set_data_zint(p->dh, dnew, mem, p->localno);

     }


     if (!p->input_format)

     {  /* SUTRS is default input_format */

         p->input_format = yaz_oid_recsyn_sutrs;

     }

     assert(p->input_format);


     if (!oid_oidcmp(p->input_format, yaz_oid_recsyn_xml))

         zebra_xml_metadata(p, top, mem);


 #if 0

     data1_pr_tree(p->dh, node, stdout);

 #endif

     if (p->comp && p->comp->which == Z_RecordComp_complex &&

         p->comp->u.complex->generic &&

         p->comp->u.complex->generic->which == Z_Schema_oid &&

         p->comp->u.complex->generic->schema.oid)

     {

         requested_schema = p->comp->u.complex->generic->schema.oid;

     }

     /* If schema has been specified, map if possible, then check that

      * we got the right one

      */

     if (requested_schema)

     {

         yaz_log(YLOG_DEBUG, "grs_retrieve: schema mapping");

         for (map = node->u.root.absyn->maptabs; map; map = map->next)

         {

             if (!oid_oidcmp(map->oid, requested_schema))

             {

                 onode = node;

                 if (!(node = data1_map_record(p->dh, onode, map, mem)))

                 {

                     p->diagnostic = YAZ_BIB1_SYSTEM_ERROR_IN_PRESENTING_RECORDS;

                     nmem_destroy(mem);

                     return 0;

                 }

                 break;

             }

         }

         if (node->u.root.absyn

             && oid_oidcmp(requested_schema, node->u.root.absyn->oid))

         {

             p->diagnostic = YAZ_BIB1_RECORD_NOT_AVAILABLE_IN_REQUESTED_SYNTAX;

             nmem_destroy(mem);

             return 0;

         }

     }

     /*

      * Does the requested format match a known syntax-mapping? (this reflects

      * the overlap of schema and formatting which is inherent in the MARC

      * family)

      */

     yaz_log(YLOG_DEBUG, "grs_retrieve: syntax mapping");

     if (node->u.root.absyn)

         for (map = node->u.root.absyn->maptabs; map; map = map->next)

         {

             if (!oid_oidcmp(map->oid, p->input_format))

             {

                 onode = node;

                 if (!(node = data1_map_record(p->dh, onode, map, mem)))

                 {

                     p->diagnostic = YAZ_BIB1_SYSTEM_ERROR_IN_PRESENTING_RECORDS;

                     nmem_destroy(mem);

                     return 0;

                 }

                 break;

             }

         }

     yaz_log(YLOG_DEBUG, "grs_retrieve: schemaIdentifier");

     if (node->u.root.absyn && node->u.root.absyn->oid

         && !oid_oidcmp(p->input_format, yaz_oid_recsyn_grs_1))

     {

         char oid_str[OID_STR_MAX];

         char *dot_str = oid_oid_to_dotstring(node->u.root.absyn->oid, oid_str);


         if (dot_str && (dnew = data1_mk_tag_data_wd(p->dh, top,

                                                     "schemaIdentifier", mem)))

         {

             dnew->u.data.what = DATA1I_oid;

             dnew->u.data.data = (char *) nmem_strdup(mem, dot_str);

             dnew->u.data.len = strlen(dot_str);

         }

     }


     yaz_log(YLOG_DEBUG, "grs_retrieve: element spec");

     if (p->comp && (res = process_comp(p->dh, node, p->comp, &p->addinfo,

                                        p->odr)) > 0)

     {

         p->diagnostic = res;

         nmem_destroy(mem);

         return 0;

     }

     else if (p->comp && !res)

         selected = 1;


 #if 0

     data1_pr_tree(p->dh, node, stdout);

 #endif

     yaz_log(YLOG_DEBUG, "grs_retrieve: transfer syntax mapping");


     p->output_format = p->input_format;


     assert(p->input_format);

     if (!oid_oidcmp(p->input_format, yaz_oid_recsyn_xml))

     {

 #if 0

         data1_pr_tree(p->dh, node, stdout);

 #endif

         /* default output encoding for XML is UTF-8 */

         data1_iconv(p->dh, mem, node,

                      p->encoding ? p->encoding : "UTF-8",

                      data1_get_encoding(p->dh, node));


         if (!(p->rec_buf = data1_nodetoidsgml(p->dh, node, selected,

                                               &p->rec_len)))

             p->diagnostic = YAZ_BIB1_RECORD_NOT_AVAILABLE_IN_REQUESTED_SYNTAX;

         else

         {

             char *new_buf = (char*) odr_malloc(p->odr, p->rec_len);

             memcpy(new_buf, p->rec_buf, p->rec_len);

             p->rec_buf = new_buf;

         }

     }

     else if (!oid_oidcmp(p->input_format, yaz_oid_recsyn_grs_1))

     {

         data1_iconv(p->dh, mem, node, "UTF-8", data1_get_encoding(p->dh, node));

         dummy = 0;

         if (!(p->rec_buf = data1_nodetogr(p->dh, node, selected,

                                           p->odr, &dummy)))

             p->diagnostic = YAZ_BIB1_RECORD_NOT_AVAILABLE_IN_REQUESTED_SYNTAX;

         else

             p->rec_len = -1;

     }

     else if (!oid_oidcmp(p->input_format, yaz_oid_recsyn_explain))

     {

         /* ensure our data1 tree is UTF-8 */

         data1_iconv(p->dh, mem, node, "UTF-8", data1_get_encoding(p->dh, node));


         if (!(p->rec_buf = data1_nodetoexplain(p->dh, node, selected,

                                                p->odr)))

             p->diagnostic = YAZ_BIB1_RECORD_NOT_AVAILABLE_IN_REQUESTED_SYNTAX;

         else

             p->rec_len = -1;

     }

     else if (!oid_oidcmp(p->input_format, yaz_oid_recsyn_summary))

     {

         /* ensure our data1 tree is UTF-8 */

         data1_iconv(p->dh, mem, node, "UTF-8", data1_get_encoding(p->dh, node));

         if (!(p->rec_buf = data1_nodetosummary(p->dh, node, selected,

                                                p->odr)))

             p->diagnostic = YAZ_BIB1_RECORD_NOT_AVAILABLE_IN_REQUESTED_SYNTAX;

         else

             p->rec_len = -1;

     }

     else if (!oid_oidcmp(p->input_format, yaz_oid_recsyn_sutrs))

     {

         if (p->encoding)

             data1_iconv(p->dh, mem, node, p->encoding,

                          data1_get_encoding(p->dh, node));

         if (!(p->rec_buf = data1_nodetobuf(p->dh, node, selected,

                                            &p->rec_len)))

             p->diagnostic = YAZ_BIB1_RECORD_NOT_AVAILABLE_IN_REQUESTED_SYNTAX;

         else

         {

             char *new_buf = (char*) odr_malloc(p->odr, p->rec_len);

             memcpy(new_buf, p->rec_buf, p->rec_len);

             p->rec_buf = new_buf;

         }

     }

     else if (!oid_oidcmp(p->input_format, yaz_oid_recsyn_soif))

     {

         if (p->encoding)

             data1_iconv(p->dh, mem, node, p->encoding,

                          data1_get_encoding(p->dh, node));

         if (!(p->rec_buf = data1_nodetosoif(p->dh, node, selected,

                                             &p->rec_len)))

             p->diagnostic = YAZ_BIB1_RECORD_NOT_AVAILABLE_IN_REQUESTED_SYNTAX;

         else

         {

             char *new_buf = (char*) odr_malloc(p->odr, p->rec_len);

             memcpy(new_buf, p->rec_buf, p->rec_len);

             p->rec_buf = new_buf;

         }

     }

     else

     {

         if (!node->u.root.absyn)

             p->diagnostic = YAZ_BIB1_RECORD_NOT_AVAILABLE_IN_REQUESTED_SYNTAX;

         else

         {

             for (marctab = node->u.root.absyn->marc; marctab;

                  marctab = marctab->next)

                 if (marctab->oid && !oid_oidcmp(marctab->oid, p->input_format))

                     break;

             if (!marctab)

                 p->diagnostic = YAZ_BIB1_RECORD_NOT_AVAILABLE_IN_REQUESTED_SYNTAX;

             else

             {

                 if (p->encoding)

                     data1_iconv(p->dh, mem, node, p->encoding,

                                  data1_get_encoding(p->dh, node));

                 if (!(p->rec_buf = data1_nodetomarc(p->dh, marctab, node,

                                                     selected, &p->rec_len)))

                     p->diagnostic = YAZ_BIB1_RECORD_NOT_AVAILABLE_IN_REQUESTED_SYNTAX;

                 else

                 {

                     char *new_buf = (char*) odr_malloc(p->odr, p->rec_len);

                     memcpy(new_buf, p->rec_buf, p->rec_len);

                     p->rec_buf = new_buf;

                 }

             }

         }

     }

     nmem_destroy(mem);

     return 0;

 }


 /*

  * Local variables:

  * c-basic-offset: 4

  * c-file-style: "Stroustrup"

  * indent-tabs-mode: nil

  * End:

  * vim: shiftwidth=4 tabstop=8 expandtab

  */


config.h

d1_absyn.h

data1_mk_tag
data1_node * data1_mk_tag(data1_handle dh, NMEM nmem, const char *tag, const char **attr, data1_node *at)
Definition: d1_read.c:295

data1_iconv
int data1_iconv(data1_handle dh, NMEM m, data1_node *n, const char *tocode, const char *fromcode)
Definition: d1_read.c:1058

data1_mk_tag_data_text
data1_node * data1_mk_tag_data_text(data1_handle dh, data1_node *at, const char *tag, const char *str, NMEM nmem)
Definition: d1_read.c:526

data1_concat_text
void data1_concat_text(data1_handle dh, NMEM m, data1_node *n)
Definition: d1_read.c:1107

data1_mk_tag_data_wd
data1_node * data1_mk_tag_data_wd(data1_handle dh, data1_node *at, const char *tagname, NMEM m)
Definition: d1_read.c:461

data1_nodetosoif
char * data1_nodetosoif(data1_handle dh, data1_node *n, int select, int *len)
Definition: d1_soif.c:74

data1_nodetoidsgml
char * data1_nodetoidsgml(data1_handle dh, data1_node *n, int select, int *len)
Definition: d1_write.c:230

DATA1I_oid
#define DATA1I_oid
Definition: data1.h:318

data1_set_data_zint
void data1_set_data_zint(data1_handle dh, data1_node *res, NMEM m, zint num)
Definition: d1_read.c:403

data1_get_root_tag
data1_node * data1_get_root_tag(data1_handle dh, data1_node *n)
Definition: d1_read.c:36

data1_pr_tree
void data1_pr_tree(data1_handle dh, data1_node *n, FILE *out)
Definition: d1_prtree.c:134

DATA1N_tag
#define DATA1N_tag
Definition: data1.h:276

DATA1N_data
#define DATA1N_data
Definition: data1.h:278

DATA1N_root
#define DATA1N_root
Definition: data1.h:274

data1_nodetoexplain
Z_ExplainRecord * data1_nodetoexplain(data1_handle dh, data1_node *n, int select, ODR o)
Definition: d1_expout.c:1352

data1_nodetomarc
char * data1_nodetomarc(data1_handle dh, data1_marctab *p, data1_node *n, int selected, int *len)
Definition: d1_marc.c:469

data1_nodetobuf
char * data1_nodetobuf(data1_handle dh, data1_node *n, int select, int *len)
Definition: d1_sutrs.c:136

data1_getesetbyname
data1_esetname * data1_getesetbyname(data1_handle dh, data1_absyn *a, const char *name)
Definition: d1_absyn.c:298

data1_nodetosummary
Z_BriefBib * data1_nodetosummary(data1_handle dh, data1_node *n, int select, ODR o)
Definition: d1_sumout.c:55

get_parent_tag
data1_node * get_parent_tag(data1_handle dh, data1_node *n)
Definition: d1_read.c:53

data1_mk_tag_data_zint
data1_node * data1_mk_tag_data_zint(data1_handle dh, data1_node *at, const char *tag, zint num, NMEM nmem)
Definition: d1_read.c:481

data1_map_record
data1_node * data1_map_record(data1_handle dh, data1_node *n, data1_maptab *map, NMEM m)
Definition: d1_map.c:322

data1_nodetogr
Z_GenericRecord * data1_nodetogr(data1_handle dh, data1_node *n, int select, ODR o, int *len)
Definition: d1_grs.c:376

data1_doespec1
int data1_doespec1(data1_handle dh, data1_node *n, Z_Espec1 *e)
Definition: d1_doespec.c:356

DATA1_XPATH_INDEXING_ENABLE
@ DATA1_XPATH_INDEXING_ENABLE
Definition: data1.h:349

data1_remove_idzebra_subtree
void data1_remove_idzebra_subtree(data1_handle dh, data1_node *n)
Definition: d1_utils.c:64

data1_get_encoding
const char * data1_get_encoding(data1_handle dh, data1_node *n)
Definition: d1_read.c:1039

data1_systag_lookup
const char * data1_systag_lookup(data1_absyn *absyn, const char *tag, const char *default_value)
Definition: d1_absyn.c:610

data1_mk_text
data1_node * data1_mk_text(data1_handle dh, NMEM mem, const char *buf, data1_node *parent)
Definition: d1_read.c:347

DATA1T_numeric
#define DATA1T_numeric
Definition: data1.h:204

data1_mk_tag_data_int
data1_node * data1_mk_tag_data_int(data1_handle dh, data1_node *at, const char *tag, int num, NMEM nmem)
Definition: d1_read.c:494

ZEBRA_XPATH_ELM_END
#define ZEBRA_XPATH_ELM_END
Definition: recctrl.h:36

ZEBRA_XPATH_ATTR_CDATA
#define ZEBRA_XPATH_ATTR_CDATA
Definition: recctrl.h:45

RECCTRL_EXTRACT_EOF
#define RECCTRL_EXTRACT_EOF
Definition: recctrl.h:164

ZEBRA_XPATH_CDATA
#define ZEBRA_XPATH_CDATA
Definition: recctrl.h:39

ZEBRA_XPATH_ELM_BEGIN
#define ZEBRA_XPATH_ELM_BEGIN
Definition: recctrl.h:33

ZEBRA_XPATH_ATTR_NAME
#define ZEBRA_XPATH_ATTR_NAME
Definition: recctrl.h:42

RECCTRL_EXTRACT_ERROR_GENERIC
#define RECCTRL_EXTRACT_ERROR_GENERIC
Definition: recctrl.h:165

RECCTRL_EXTRACT_OK
#define RECCTRL_EXTRACT_OK
Definition: recctrl.h:163

sp_expr
static int sp_expr(struct source_parser *sp, data1_node *n, RecWord *wrd)
Definition: recgrs.c:171

index_termlist
static void index_termlist(struct source_parser *sp, data1_node *par, data1_node *n, struct recExtractCtrl *p, int level, RecWord *wrd)
Definition: recgrs.c:732

dumpkeys_r
static int dumpkeys_r(struct source_parser *sp, data1_node *n, struct recExtractCtrl *p, int level, RecWord *wrd)
Definition: recgrs.c:781

MAX_ATTR_COUNT
#define MAX_ATTR_COUNT

d1_check_xpath_predicate
int d1_check_xpath_predicate(data1_node *n, struct xpath_predicate *p)
Definition: recgrs.c:286

source_parser_destroy
static void source_parser_destroy(struct source_parser *sp)
Definition: recgrs.c:265

dfa_match_first
static int dfa_match_first(struct DFA_state **dfaar, const char *text)
Definition: recgrs.c:348

source_parser_create
static struct source_parser * source_parser_create(void)
Definition: recgrs.c:257

sp_lex
static int sp_lex(struct source_parser *sp)
Definition: recgrs.c:47

sp_parse
static int sp_parse(struct source_parser *sp, data1_node *n, RecWord *wrd, const char *src)
Definition: recgrs.c:273

xpath_termlist_by_tagpath
data1_termlist * xpath_termlist_by_tagpath(char *tagpath, data1_node *n)
Definition: recgrs.c:396

index_xpath_attr
static void index_xpath_attr(char *tag_path, char *name, char *value, char *structure, struct recExtractCtrl *p, RecWord *wrd)
Definition: recgrs.c:485

mk_tag_path_full
static void mk_tag_path_full(char *tag_path_full, size_t max, data1_node *n)
Definition: recgrs.c:510

process_comp
static int process_comp(data1_handle dh, data1_node *n, Z_RecordComposition *c, char **addinfo, ODR o)
Definition: recgrs.c:949

sp_range
static int sp_range(struct source_parser *sp, data1_node *n, RecWord *wrd)
Definition: recgrs.c:71

zebra_grs_retrieve
int zebra_grs_retrieve(void *clientData, struct recRetrieveCtrl *p, data1_node *(*grs_read)(struct grs_read_info *))
Definition: recgrs.c:1072

dumpkeys
static int dumpkeys(data1_node *n, struct recExtractCtrl *p, RecWord *wrd)
Definition: recgrs.c:877

zebra_grs_extract
int zebra_grs_extract(void *clientData, struct recExtractCtrl *p, data1_node *(*grs_read)(struct grs_read_info *))
Definition: recgrs.c:936

sp_first
static int sp_first(struct source_parser *sp, data1_node *n, RecWord *wrd)
Definition: recgrs.c:128

zebra_xml_metadata
static void zebra_xml_metadata(struct recRetrieveCtrl *p, data1_node *top, NMEM mem)
Definition: recgrs.c:1035

grs_extract_sub
static int grs_extract_sub(void *clientData, struct recExtractCtrl *p, NMEM mem, data1_node *(*grs_read)(struct grs_read_info *))
Definition: recgrs.c:898

index_xpath
static void index_xpath(struct source_parser *sp, data1_node *n, struct recExtractCtrl *p, int level, RecWord *wrd, char *xpath_index, int xpath_is_start)
Definition: recgrs.c:535

grs_extract_tree
int grs_extract_tree(struct recExtractCtrl *p, data1_node *n)
Definition: recgrs.c:885

recgrs.h

DFA_state
Definition: dfa.h:42

DFA_state::rule_no
short rule_no
Definition: dfa.h:49

DFA_state::tran_no
short tran_no
Definition: dfa.h:48

DFA_state::trans
struct DFA_tran * trans
Definition: dfa.h:45

DFA_tran
Definition: dfa.h:30

DFA_tran::to
unsigned short to
Definition: dfa.h:32

DFA_tran::ch
unsigned char ch[2]
Definition: dfa.h:31

DFA::states
struct DFA_state ** states
Definition: dfa.h:55

RecWord
Definition: recctrl.h:50

RecWord::term_buf
const char * term_buf
Definition: recctrl.h:56

RecWord::index_type
const char * index_type
Definition: recctrl.h:52

RecWord::seqno
zint seqno
Definition: recctrl.h:60

RecWord::term_len
int term_len
Definition: recctrl.h:58

RecWord::index_name
const char * index_name
Definition: recctrl.h:54

data1_absyn
Definition: d1_absyn.h:48

data1_absyn::xp_elements
struct data1_xpelement * xp_elements
Definition: d1_absyn.h:58

data1_element
Definition: data1.h:243

data1_element::tag
data1_tag * tag
Definition: data1.h:245

data1_element::name
char * name
Definition: data1.h:244

data1_esetname
Definition: data1.h:160

data1_esetname::spec
Z_Espec1 * spec
Definition: data1.h:162

data1_handle_info
Definition: d1_handle.c:31

data1_maptab
Definition: data1.h:103

data1_maptab::oid
Odr_oid * oid
Definition: data1.h:105

data1_maptab::next
struct data1_maptab * next
Definition: data1.h:108

data1_marctab
Definition: data1.h:138

data1_marctab::next
struct data1_marctab * next
Definition: data1.h:156

data1_marctab::oid
Odr_oid * oid
Definition: data1.h:140

data1_name::name
char * name
Definition: data1.h:114

data1_node
Definition: data1.h:272

data1_node::root
struct data1_node::@2::@3 root

data1_node::parent
struct data1_node * parent
Definition: data1.h:343

data1_node::child
struct data1_node * child
Definition: data1.h:341

data1_node::tag
char * tag
Definition: data1.h:296

data1_node::data
char * data
Definition: data1.h:307

data1_node::next
struct data1_node * next
Definition: data1.h:340

data1_node::u
union data1_node::@2 u

data1_node::which
int which
Definition: data1.h:285

data1_tag
Definition: data1.h:202

data1_tag::which
int which
Definition: data1.h:206

data1_tag::numeric
int numeric
Definition: data1.h:209

data1_tag::tagset
struct data1_tagset * tagset
Definition: data1.h:214

data1_tag::names
data1_name * names
Definition: data1.h:203

data1_tag::value
union data1_tag::@1 value

data1_tag::string
char * string
Definition: data1.h:210

data1_tagset::name
char * name
Definition: data1.h:223

data1_tagset::type
int type
Definition: data1.h:222

data1_termlist
Definition: data1.h:231

data1_termlist::structure
char * structure
Definition: data1.h:233

data1_termlist::next
struct data1_termlist * next
Definition: data1.h:235

data1_termlist::index_name
char * index_name
Definition: data1.h:232

data1_termlist::source
char * source
Definition: data1.h:234

data1_xattr
Definition: data1.h:259

data1_xattr::value
char * value
Definition: data1.h:261

data1_xattr::name
char * name
Definition: data1.h:260

data1_xattr::next
struct data1_xattr * next
Definition: data1.h:262

data1_xpelement
Definition: d1_absyn.h:31

data1_xpelement::termlists
data1_termlist * termlists
Definition: d1_absyn.h:38

data1_xpelement::match_state
int match_state
Definition: d1_absyn.h:43

data1_xpelement::xpath
struct xpath_location_step xpath[XPATH_STEP_COUNT]
Definition: d1_absyn.h:34

data1_xpelement::match_next
struct data1_xpelement * match_next
Definition: d1_absyn.h:44

data1_xpelement::dfa
struct DFA * dfa
Definition: d1_absyn.h:37

data1_xpelement::xpath_len
int xpath_len
Definition: d1_absyn.h:35

data1_xpelement::next
struct data1_xpelement * next
Definition: d1_absyn.h:39

grs_read_info
Definition: recgrs.h:27

grs_read_info::dh
data1_handle dh
Definition: recgrs.h:31

grs_read_info::stream
struct ZebraRecStream * stream
Definition: recgrs.h:28

grs_read_info::clientData
void * clientData
Definition: recgrs.h:29

grs_read_info::mem
NMEM mem
Definition: recgrs.h:30

recExtractCtrl
record extract for indexing
Definition: recctrl.h:101

recExtractCtrl::flagShowRecords
int flagShowRecords
Definition: recctrl.h:108

recExtractCtrl::init
void(* init)(struct recExtractCtrl *p, RecWord *w)
Definition: recctrl.h:103

recExtractCtrl::tokenAdd
void(* tokenAdd)(RecWord *w)
Definition: recctrl.h:105

recExtractCtrl::schemaAdd
void(* schemaAdd)(struct recExtractCtrl *p, Odr_oid *oid)
Definition: recctrl.h:111

recExtractCtrl::dh
data1_handle dh
Definition: recctrl.h:112

recExtractCtrl::stream
struct ZebraRecStream * stream
Definition: recctrl.h:102

recRetrieveCtrl
Definition: recctrl.h:118

recRetrieveCtrl::input_format
const Odr_oid * input_format
Definition: recctrl.h:123

recRetrieveCtrl::dh
data1_handle dh
Definition: recctrl.h:131

recRetrieveCtrl::addinfo
char * addinfo
Definition: recctrl.h:138

recRetrieveCtrl::comp
Z_RecordComposition * comp
Definition: recctrl.h:124

recRetrieveCtrl::rec_len
int rec_len
Definition: recctrl.h:136

recRetrieveCtrl::stream
struct ZebraRecStream * stream
Definition: recctrl.h:119

recRetrieveCtrl::localno
zint localno
Definition: recctrl.h:126

recRetrieveCtrl::output_format
const Odr_oid * output_format
Definition: recctrl.h:134

recRetrieveCtrl::recordSize
int recordSize
Definition: recctrl.h:129

recRetrieveCtrl::diagnostic
int diagnostic
Definition: recctrl.h:137

recRetrieveCtrl::encoding
char * encoding
Definition: recctrl.h:125

recRetrieveCtrl::score
int score
Definition: recctrl.h:127

recRetrieveCtrl::fname
char * fname
Definition: recctrl.h:130

recRetrieveCtrl::rec_buf
void * rec_buf
Definition: recctrl.h:135

recRetrieveCtrl::odr
ODR odr
Definition: recctrl.h:122

source_parser
Definition: recgrs.c:39

source_parser::src
const char * src
Definition: recgrs.c:42

source_parser::len
int len
Definition: recgrs.c:40

source_parser::lookahead
int lookahead
Definition: recgrs.c:43

source_parser::nmem
NMEM nmem
Definition: recgrs.c:44

source_parser::tok
const char * tok
Definition: recgrs.c:41

xpath_location_step
Definition: zebra_xpath.h:44

xpath_location_step::predicate
struct xpath_predicate * predicate
Definition: zebra_xpath.h:46

xpath_predicate
Definition: zebra_xpath.h:26

xpath_predicate::which
int which
Definition: zebra_xpath.h:27

xpath_predicate::u
union xpath_predicate::@8 u

xpath_predicate::relation
struct xpath_predicate::@8::@9 relation

xpath_predicate::boolean
struct xpath_predicate::@8::@10 boolean

zint
long zint
Zebra integer.
Definition: util.h:66

XPATH_PREDICATE_BOOLEAN
#define XPATH_PREDICATE_BOOLEAN
Definition: zebra_xpath.h:35

XPATH_PREDICATE_RELATION
#define XPATH_PREDICATE_RELATION
Definition: zebra_xpath.h:29