https://issues.shibboleth.net/jira/browse/CPPXT-54
[shibboleth/cpp-xmltooling.git] / xmltooling / util / ReloadableXMLFile.cpp
1 /*
2  *  Copyright 2001-2010 Internet2
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  *     http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 /**
18  * @file ReloadableXMLFile.cpp
19  *
20  * Base class for file-based XML configuration.
21  */
22
23 #include "internal.h"
24 #include "io/HTTPResponse.h"
25 #include "util/NDC.h"
26 #include "util/PathResolver.h"
27 #include "util/ReloadableXMLFile.h"
28 #include "util/Threads.h"
29 #include "util/XMLConstants.h"
30 #include "util/XMLHelper.h"
31
32 #if defined(XMLTOOLING_LOG4SHIB)
33 # include <log4shib/NDC.hh>
34 #elif defined(XMLTOOLING_LOG4CPP)
35 # include <log4cpp/NDC.hh>
36 #endif
37
38 #include <fstream>
39 #include <sys/types.h>
40 #include <sys/stat.h>
41
42 #include <xercesc/framework/LocalFileInputSource.hpp>
43 #include <xercesc/framework/Wrapper4InputSource.hpp>
44 #include <xercesc/util/XMLUniDefs.hpp>
45
46 using namespace xmltooling::logging;
47 using namespace xmltooling;
48 using namespace xercesc;
49 using namespace std;
50
51 static const XMLCh id[] =               UNICODE_LITERAL_2(i,d);
52 static const XMLCh uri[] =              UNICODE_LITERAL_3(u,r,i);
53 static const XMLCh url[] =              UNICODE_LITERAL_3(u,r,l);
54 static const XMLCh path[] =             UNICODE_LITERAL_4(p,a,t,h);
55 static const XMLCh pathname[] =         UNICODE_LITERAL_8(p,a,t,h,n,a,m,e);
56 static const XMLCh file[] =             UNICODE_LITERAL_4(f,i,l,e);
57 static const XMLCh filename[] =         UNICODE_LITERAL_8(f,i,l,e,n,a,m,e);
58 static const XMLCh validate[] =         UNICODE_LITERAL_8(v,a,l,i,d,a,t,e);
59 static const XMLCh reloadChanges[] =    UNICODE_LITERAL_13(r,e,l,o,a,d,C,h,a,n,g,e,s);
60 static const XMLCh reloadInterval[] =   UNICODE_LITERAL_14(r,e,l,o,a,d,I,n,t,e,r,v,a,l);
61 static const XMLCh backingFilePath[] =  UNICODE_LITERAL_15(b,a,c,k,i,n,g,F,i,l,e,P,a,t,h);
62
63
64 ReloadableXMLFile::ReloadableXMLFile(const DOMElement* e, Category& log)
65     : m_root(e), m_local(true), m_validate(false), m_filestamp(0), m_reloadInterval(0), m_lock(NULL), m_log(log),
66         m_shutdown(false), m_reload_wait(NULL), m_reload_thread(NULL)
67 {
68 #ifdef _DEBUG
69     NDC ndc("ReloadableXMLFile");
70 #endif
71
72     // Establish source of data...
73     const XMLCh* source=e->getAttributeNS(NULL,uri);
74     if (!source || !*source) {
75         source=e->getAttributeNS(NULL,url);
76         if (!source || !*source) {
77             source=e->getAttributeNS(NULL,path);
78             if (!source || !*source) {
79                 source=e->getAttributeNS(NULL,pathname);
80                 if (!source || !*source) {
81                     source=e->getAttributeNS(NULL,file);
82                     if (!source || !*source) {
83                         source=e->getAttributeNS(NULL,filename);
84                     }
85                 }
86             }
87         }
88         else
89             m_local=false;
90     }
91     else
92         m_local=false;
93
94     if (source && *source) {
95         const XMLCh* flag=e->getAttributeNS(NULL,validate);
96         m_validate=(XMLString::equals(flag,xmlconstants::XML_TRUE) || XMLString::equals(flag,xmlconstants::XML_ONE));
97
98         auto_ptr_char temp(source);
99         m_source=temp.get();
100
101         if (!m_local && !strstr(m_source.c_str(),"://")) {
102             log.warn("deprecated usage of uri/url attribute for a local resource, use path instead");
103             m_local=true;
104         }
105
106         if (m_local) {
107             XMLToolingConfig::getConfig().getPathResolver()->resolve(m_source, PathResolver::XMLTOOLING_CFG_FILE);
108
109             flag=e->getAttributeNS(NULL,reloadChanges);
110             if (!XMLString::equals(flag,xmlconstants::XML_FALSE) && !XMLString::equals(flag,xmlconstants::XML_ZERO)) {
111 #ifdef WIN32
112                 struct _stat stat_buf;
113                 if (_stat(m_source.c_str(), &stat_buf) == 0)
114 #else
115                 struct stat stat_buf;
116                 if (stat(m_source.c_str(), &stat_buf) == 0)
117 #endif
118                     m_filestamp=stat_buf.st_mtime;
119                 else
120                     throw IOException("Unable to access local file ($1)", params(1,m_source.c_str()));
121                 m_lock=RWLock::create();
122             }
123             log.debug("using local resource (%s), will %smonitor for changes", m_source.c_str(), m_lock ? "" : "not ");
124         }
125         else {
126             log.debug("using remote resource (%s)", m_source.c_str());
127             source = e->getAttributeNS(NULL,backingFilePath);
128             if (source && *source) {
129                 auto_ptr_char temp2(source);
130                 m_backing=temp2.get();
131                 XMLToolingConfig::getConfig().getPathResolver()->resolve(m_backing, PathResolver::XMLTOOLING_RUN_FILE);
132                 log.debug("backup remote resource with (%s)", m_backing.c_str());
133             }
134             source = e->getAttributeNS(NULL,reloadInterval);
135             if (source && *source) {
136                 m_reloadInterval = XMLString::parseInt(source);
137                 if (m_reloadInterval > 0) {
138                     m_log.debug("will reload remote resource at most every %d seconds", m_reloadInterval);
139                     m_lock=RWLock::create();
140                 }
141             }
142             m_filestamp = time(NULL);   // assume it gets loaded initially
143         }
144
145         if (m_lock) {
146             m_reload_wait = CondWait::create();
147             m_reload_thread = Thread::create(&reload_fn, this);
148         }
149     }
150     else {
151         log.debug("no resource uri/path/name supplied, will load inline configuration");
152     }
153
154     source = e->getAttributeNS(NULL, id);
155     if (source && *source) {
156         auto_ptr_char tempid(source);
157         m_id = tempid.get();
158     }
159 }
160
161 ReloadableXMLFile::~ReloadableXMLFile()
162 {
163     if (m_reload_thread) {
164         // Shut down the reload thread and let it know.
165         m_shutdown = true;
166         m_reload_wait->signal();
167         m_reload_thread->join(NULL);
168         delete m_reload_thread;
169         delete m_reload_wait;
170     }
171
172     delete m_lock;
173 }
174
175 void* ReloadableXMLFile::reload_fn(void* pv)
176 {
177     ReloadableXMLFile* r = reinterpret_cast<ReloadableXMLFile*>(pv);
178
179 #ifndef WIN32
180     // First, let's block all signals
181     Thread::mask_all_signals();
182 #endif
183
184     if (!r->m_id.empty()) {
185         string threadid("[");
186         threadid += r->m_id + ']';
187         logging::NDC::push(threadid);
188     }
189
190 #ifdef _DEBUG
191     NDC ndc("reload");
192 #endif
193
194     auto_ptr<Mutex> mutex(Mutex::create());
195     mutex->lock();
196
197     if (r->m_local)
198         r->m_log.info("reload thread started...running when signaled");
199     else
200         r->m_log.info("reload thread started...running every %d seconds", r->m_reloadInterval);
201
202     while (!r->m_shutdown) {
203         if (r->m_local)
204             r->m_reload_wait->wait(mutex.get());
205         else
206             r->m_reload_wait->timedwait(mutex.get(), r->m_reloadInterval);
207         if (r->m_shutdown)
208             break;
209
210         try {
211             r->m_log.info("reloading %s resource...", r->m_local ? "local" : "remote");
212             pair<bool,DOMElement*> ret = r->background_load();
213             if (ret.first)
214                 ret.second->getOwnerDocument()->release();
215         }
216         catch (long& ex) {
217             if (ex == HTTPResponse::XMLTOOLING_HTTP_STATUS_NOTMODIFIED) {
218                 r->m_log.info("remote resource (%s) unchanged from cached version", r->m_source.c_str());
219             }
220             else {
221                 // Shouldn't happen, we should only get codes intended to be gracefully handled.
222                 r->m_log.crit("maintaining existing configuration, remote resource fetch returned atypical status code (%d)", ex);
223             }
224         }
225         catch (exception& ex) {
226             r->m_log.crit("maintaining existing configuration, error reloading resource (%s): %s", r->m_source.c_str(), ex.what());
227         }
228     }
229
230     r->m_log.info("reload thread finished");
231
232     mutex->unlock();
233
234     if (!r->m_id.empty()) {
235         logging::NDC::pop();
236     }
237
238     return NULL;
239 }
240
241 Lockable* ReloadableXMLFile::lock()
242 {
243     if (!m_lock)
244         return this;
245
246     m_lock->rdlock();
247
248     if (m_local) {
249     // Check if we need to refresh.
250 #ifdef WIN32
251         struct _stat stat_buf;
252         if (_stat(m_source.c_str(), &stat_buf) != 0)
253             return this;
254 #else
255         struct stat stat_buf;
256         if (stat(m_source.c_str(), &stat_buf) != 0)
257             return this;
258 #endif
259         if (m_filestamp >= stat_buf.st_mtime)
260             return this;
261
262         // Elevate lock and recheck.
263         m_log.debug("timestamp of local resource changed, elevating to a write lock");
264         m_lock->unlock();
265         m_lock->wrlock();
266         if (m_filestamp >= stat_buf.st_mtime) {
267             // Somebody else handled it, just downgrade.
268             m_log.debug("update of local resource handled by another thread, downgrading lock");
269             m_lock->unlock();
270             m_lock->rdlock();
271             return this;
272         }
273
274         // Update the timestamp regardless.
275         m_filestamp = stat_buf.st_mtime;
276         m_log.info("change detected, signaling reload thread...");
277         m_reload_wait->signal();
278     }
279
280     return this;
281 }
282
283 void ReloadableXMLFile::unlock()
284 {
285     if (m_lock)
286         m_lock->unlock();
287 }
288
289 pair<bool,DOMElement*> ReloadableXMLFile::load(bool backup)
290 {
291 #ifdef _DEBUG
292     NDC ndc("load");
293 #endif
294
295     try {
296         if (m_source.empty()) {
297             // Data comes from the DOM we were handed.
298             m_log.debug("loading inline configuration...");
299             return make_pair(false, XMLHelper::getFirstChildElement(m_root));
300         }
301         else {
302             // Data comes from a file we have to parse.
303             if (backup)
304                 m_log.warn("using local backup of remote resource");
305             else
306                 m_log.debug("loading configuration from external resource...");
307
308             DOMDocument* doc=NULL;
309             if (m_local || backup) {
310                 auto_ptr_XMLCh widenit(backup ? m_backing.c_str() : m_source.c_str());
311                 LocalFileInputSource src(widenit.get());
312                 Wrapper4InputSource dsrc(&src, false);
313                 if (m_validate)
314                     doc=XMLToolingConfig::getConfig().getValidatingParser().parse(dsrc);
315                 else
316                     doc=XMLToolingConfig::getConfig().getParser().parse(dsrc);
317             }
318             else {
319                 URLInputSource src(m_root, NULL, &m_cacheTag);
320                 Wrapper4InputSource dsrc(&src, false);
321                 if (m_validate)
322                     doc=XMLToolingConfig::getConfig().getValidatingParser().parse(dsrc);
323                 else
324                     doc=XMLToolingConfig::getConfig().getParser().parse(dsrc);
325
326                 // Check for a response code signal.
327                 if (XMLHelper::isNodeNamed(doc->getDocumentElement(), xmlconstants::XMLTOOLING_NS, URLInputSource::utf16StatusCodeElementName)) {
328                     int responseCode = XMLString::parseInt(doc->getDocumentElement()->getFirstChild()->getNodeValue());
329                     doc->release();
330                     if (responseCode == HTTPResponse::XMLTOOLING_HTTP_STATUS_NOTMODIFIED) {
331                         throw (long)responseCode; // toss out as a "known" case to handle gracefully
332                     }
333                     else {
334                         m_log.warn("remote resource fetch returned atypical status code (%d)", responseCode);
335                         throw IOException("remote resource fetch failed, check log for status code of response");
336                     }
337                 }
338             }
339
340             m_log.infoStream() << "loaded XML resource (" << (backup ? m_backing : m_source) << ")" << logging::eol;
341
342             if (!backup && !m_backing.empty()) {
343                 m_log.debug("backing up remote resource to (%s)", m_backing.c_str());
344                 try {
345                     ofstream backer(m_backing.c_str());
346                     backer << *doc;
347                 }
348                 catch (exception& ex) {
349                     m_log.crit("exception while backing up resource: %s", ex.what());
350                 }
351             }
352
353             return make_pair(true, doc->getDocumentElement());
354         }
355     }
356     catch (XMLException& e) {
357         auto_ptr_char msg(e.getMessage());
358         m_log.errorStream() << "Xerces error while loading resource (" << (backup ? m_backing : m_source) << "): "
359             << msg.get() << logging::eol;
360         if (!backup && !m_backing.empty())
361             return load(true);
362         throw XMLParserException(msg.get());
363     }
364     catch (exception& e) {
365         m_log.errorStream() << "error while loading resource ("
366             << (m_source.empty() ? "inline" : (backup ? m_backing : m_source)) << "): " << e.what() << logging::eol;
367         if (!backup && !m_backing.empty())
368             return load(true);
369         throw;
370     }
371 }
372
373 pair<bool,DOMElement*> ReloadableXMLFile::load()
374 {
375     return load(false);
376 }
377
378 pair<bool,DOMElement*> ReloadableXMLFile::background_load()
379 {
380     // If this method isn't overridden, we acquire a write lock
381     // and just call the old override.
382     m_lock->wrlock();
383     SharedLock locker(m_lock, false);
384     return load();
385 }