WO2014049804A1 - 分散システムにおけるシステム動作トレース方法 - Google Patents

分散システムにおけるシステム動作トレース方法 Download PDF

Info

Publication number
WO2014049804A1
WO2014049804A1 PCT/JP2012/075002 JP2012075002W WO2014049804A1 WO 2014049804 A1 WO2014049804 A1 WO 2014049804A1 JP 2012075002 W JP2012075002 W JP 2012075002W WO 2014049804 A1 WO2014049804 A1 WO 2014049804A1
Authority
WO
WIPO (PCT)
Prior art keywords
log data
log
information
data
order
Prior art date
Application number
PCT/JP2012/075002
Other languages
English (en)
French (fr)
Inventor
山本 秀典
恭 福本
外岡 秀樹
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to US14/419,874 priority Critical patent/US20150169288A1/en
Priority to EP12885860.2A priority patent/EP2902908A4/en
Priority to PCT/JP2012/075002 priority patent/WO2014049804A1/ja
Priority to JP2014537973A priority patent/JPWO2014049804A1/ja
Publication of WO2014049804A1 publication Critical patent/WO2014049804A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/22Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc
    • G06F7/24Sorting, i.e. extracting data from one or more carriers, rearranging the data in numerical or other ordered sequence, and rerecording the sorted data on the original carrier or on a different carrier or set of carriers sorting methods in general
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • G06F11/3075Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved in order to maintain consistency among the monitored data, e.g. ensuring that the monitored data belong to the same timeframe, to the same system or component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • G06F11/3082Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved by aggregating or compressing the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/328Computer systems status display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging

Definitions

  • the present invention is directed to a distributed system composed of a plurality of independent nodes interconnected via a network and interconnected between different main systems in the field of smart grid or electric power.
  • the present invention relates to a method for tracing the flow of data and operations across different system ranges in the format, acquisition method, and the like of log data generated by executing processing in each node.
  • a log information recording unit in which log information indicating the operation status of a computer is recorded, a time at which the log information is recorded from the log information recorded in the log information recording unit, a predetermined character string
  • a general-purpose log creating means for creating a general-purpose log that includes a time converted into a predetermined time format and a predetermined character string converted into a predetermined format; and the general-purpose log created by the general-purpose log generating means Are recorded in the general-purpose log recording means, the general-purpose log recording section having the general-purpose log recorded by the general-purpose log recording means, and the general-purpose log recording section.
  • Feature information extraction means for extracting feature information including the length of log information corresponding to the general-purpose log and the appearance frequency of words appearing in the log information from the log information recording unit;
  • the predetermined log information analysis apparatus characterized by comprising a display means for displaying the order of the converted time to the time format has been proposed with the log information by graphically the extracted log information by means.
  • the present invention is intended for distributed systems in the field of smart grids, etc., where one or more systems with different introduction scope / time, compliance standards, vendors, etc. are connected and linked to each other, Data and operational flow Possible system.
  • it is difficult to give a unified index to log data individually stored and managed. For this reason, it is burdensome to track the flow of data and operations from the accumulated log data.
  • the granularity of the data output to the log is different, even if all logs are presented to the user, it may be difficult for the user to understand or include unnecessary data.
  • the present invention takes the above-mentioned problems into consideration, and one or more systems having different introduction ranges / times, compliant standards, vendors, and the like are mutually connected and linked, and the flow of data and operations across the systems.
  • the present invention has the following configuration.
  • hardware or software composed of a plurality of independent nodes interconnected via a network and having different introduction range / time, compliance standard, processing content, processing target layer, etc. is introduced, and the hardware is associated with the execution of the processing.
  • One or more nodes that output and store log data according to the specifications or data format of the hardware or software, one or more operation servers that collect, store, and collectively manage log data output from the nodes, the log data
  • log data output as a result of processing execution in one or more nodes constituting the distributed system is stored in the operation server.
  • FIG. 1 is a diagram showing an outline of a usage form of a system operation tracing method in a distributed system according to the present invention.
  • the log data is acquired from the operation server (0112, 0126), and the log data is stored in the sequence array 0135 for arranging and displaying in sequence. Displayed via the user interface 0121.
  • the log data targeted in this embodiment includes, for example, processing logs such as message transmission and reception, DB access (reading and writing), operator operation logs that trigger processing start / relay, operator work records, etc. Further, it is a log related to processing such as a master / slave switching log and an operation mode (online, test, standby, etc.) switching log.
  • FIG. 2 is a diagram showing an overview of a distributed system to which the present invention is applied.
  • Main components are field equipment (0221, etc.), controller (0207), field network (0215), wide area network (0213), gateway server (0205), LAN (0212, etc.), firewall server (0204), application A server (0203), an operation server (0112), and a user terminal (0208).
  • the field device is a device arranged at the control system site.
  • the control controller is a device that controls the field devices 0221 and 0222 via the field network 0215.
  • the gateway server is a gateway to the wide area network 0213 in the system 1 (0102), interconnected with the controller 0207 via the wide area network 0213.
  • the firewall server is a server serving as a firewall between the LANs 0212 and 0211 in the system 1 (0102).
  • the application server is a server that is connected to the LAN 0211 and accumulates data and executes business applications.
  • the operation server is a server that accumulates log data in the system 1 (0102), manages system configuration information, and the like.
  • the user terminal is a terminal for the user 0101 to refer to log data and the like.
  • the system 2 (0103) has the same configuration as the system 1.
  • the processing nodes (0113, 0114) or the accumulation node 0115 in FIG. 1 correspond to the controller 0207, gateway server 0205, server 0204, and server 0203 in FIG.
  • the main hardware configuration of the user terminal 0111 includes a processing device (CPU) 0231, a storage device (memory, hard disk) 0232, and a communication device 0233.
  • the operation server 0112, the server 0203, the gateway server 0205, and the controller 0207 also include a processing device (CPU), a storage device (memory, hard disk), and a communication device.
  • FIG. 3 is a diagram showing an outline of a method for associating individual log data generated and stored in each node constituting the distributed system according to the present invention.
  • the message data transmitted by the application program in the controller 0207 passes through the wide area network 0213, the gateway server 0205, the LAN 0212, the server 0204, the LAN 0211, the server 0203, the LAN 0211, the server 0204, the LAN 0212, the gateway server 0206, the wide area network 0214, and the LAN 0216. Is transmitted to the server 0208.
  • the data flow at this time is a line (0301) described in the figure.
  • processing 0302 ((1) to (8)) in each node is executed in different communication layers (L1 to L7) and log data 0311 is output.
  • log data of processes (1) and (2) are linked by “route ID (information identifying communication path)”, and log data of processes (2) and (3) are by “TID (thread ID)”.
  • Linking and processing (4) and (5) log data is linked by “PID (process ID)”
  • processing (5) and (6) log data is linked by “DN (data name)” and processing
  • the log data of (6) and (7) are linked by “PID (process ID)”.
  • FIG. 4 is a diagram for explaining the module configuration of the operation server.
  • the operation server performs accumulation and management of log data collected in the system, management of system information, and the like.
  • the operation server 0112 is installed with middleware 0401 for collecting, accumulating, managing and providing log data to the user terminal 0111 and a log data accumulating DB 0402 for accumulating log data.
  • the main components of the middleware 0401 receive log data generated at each node from the processing nodes (0113, 0114, 0115) and the storage node 0115 in the system via the data communication unit 0415, and store them in the log data storage DB0402.
  • a search request from the user terminal 0111 is received via the log data collection / accumulation unit 0411 to be accumulated, the log data management unit 0412 that manages the log data accumulated in the log data accumulation DB 0402, and the data communication unit 0415, and the log data accumulation DB 0402
  • the app Activation data definition information 0421, system information management unit 0414 to respond to queries about the system configuration information 0422, which via a communication medium 0211 a data communication unit 0415 for performing communication processing with other nodes.
  • FIG. 5 is a diagram illustrating the module configuration of the user terminal.
  • the user terminal performs link creation, display, user interface provision, and the like for log data collected in the system.
  • the user terminal 0111 includes log data acquisition and display data creation, display, etc., middleware 0501, a temporary data storage area 0502 for temporarily storing log data acquired and processed from the operation server 0112, information presentation to the user, A user interface 0121 that provides operations is introduced.
  • the main components of the middleware 0501 are based on the range and conditions specified by the user 0101 using the user interface 0121 via the user interface execution management unit 0514 and to the operation server 0112 via the data communication unit 0515.
  • Log data search unit 0511 that performs search processing of log data, log data that is a search result is acquired from log data search unit 0511, extraction of linkage between log data and creation of a sequence array based on the linkage
  • Log data association creation unit 0512 creates an array for sequence of log data, and obtains application data definition information, system configuration information, etc.
  • the data communication unit 0515 performs communication processing with the operation server 0112 via the communication medium 0211. Note that the log data association creation unit 0512 and the display data creation unit 0513 store intermediate data or the like in the temporary data storage area 0502 as necessary during the process.
  • FIG. 6 is a diagram showing an example of a data format of log data used in the distributed system according to the present invention.
  • Main components of the log data format 0601 are header information 0611 and a log data body 0612.
  • the header information 0611 is information for supplementing the log data stored in the log data body 0612.
  • the generation time 0621, the data size 0622, the process ID 0623, the thread ID 0624, the transmission source information 0625, the destination information 0626, the path Information 0627, protocol information 0628, data identification information 0629, business identification information 0620, and the like are included. All of these pieces of information are not necessarily included, but include information that can be output in each process of each node that is a generation source of log data. Information other than the above 0621 to 0620 may be included.
  • the log data body 0612 stores log data generated in each process of each node.
  • FIG. 7 is a flowchart showing a flow of processing for acquiring log data and creating a link. *
  • step 0701 the user terminal 0111 accepts specification of a range of log data to be referred to by the user 0101, conditions, and the like.
  • conditions such as time range, target computer range, log data type, search procedure, and the like are designated.
  • step 0702 log data is searched for the operation server 0112 according to the range, conditions, etc. accepted in step 0701.
  • step 0703 as a result of step 0702, the corresponding log data is acquired from the operation server 0112 having the corresponding log data.
  • step 0704 if log data acquisition from the operation server 0112 having all corresponding log data has not been completed, the processing of step 0702 and step 0703 is repeated.
  • step 0704 if log data acquisition from the operation server 0112 having all corresponding log data has been completed, in step 0705, the user uses the user terminal 0208 from the log data acquired up to step 0704. Then, log data corresponding to conditions such as a node designated as a starting point, time, and processing are selected.
  • the starting point is the log at the start of processing or business, or the log of the first location that the user wants to refer to.
  • step 0706 the header information of each log data is referred.
  • step 0707 if there is unique identification information as a result of step 0706, in step 0708, log data that can be linked is extracted using the unique identification information, and stored in a sequence array.
  • step 0707 when there is no unique identification information as a result of step 0706, in step 0709, the last log data stored in the sequence array and other unstored log data are stored in the array next. Match the contents with the log data to be processed.
  • step 0710 if there is log data that can be linked as a result of step 0709, the corresponding log data is extracted and stored in the sequence array in step 0711.
  • step 0710 if there is no log data that can be linked as a result of step 0709, in step 0712, the related data is referenced, and the last log data stored in the sequence array and other unstored log data Next, the relationship between the log data to be stored in the array is extracted.
  • step 0713 if there is log data that can be linked as a result of step 0712, in step 0714, the corresponding log data is extracted and stored in the sequence array. In step 0713, if there is no log data that can be linked as a result of step 0712, nothing is done.
  • step 0715 when confirmation has been completed for all log data acquired up to step 0704, in step 0716, the sequence array for log data is completed, and display processing for the sequence array is performed. If it is determined in step 0715 that confirmation has not been completed for all log data acquired up to step 0704, the processing from step 0706 to step 0714 is repeated.
  • unique identification information includes information such as process ID and thread ID.
  • the destination information, the transmission source information and the serial number included in the log data in the transmission process and the destination information, the transmission source information and the serial number included in the log data in the reception process are used for content matching between the log data.
  • related information to be referred for extracting the relationship of log data there are a master / slave switching log, an operation mode switching log, and the like. For example, in a plurality of computers that are operating in parallel in a multiple system, only the log of the computer that is the master is extracted and linked. In addition, processing such as log data extraction and association is performed only for one or more computers having the same operation mode.
  • FIG. 8 is a flowchart showing a flow of processing for displaying log data after association on the user terminal.
  • step 0801 the sequence for log data sequence is completed according to the flowchart shown in FIG.
  • step 0802 when application data is displayed as designation of the user 0101 in the user terminal 0111, application data definition information is referred to in step 0803.
  • step 0804 the application data definition information in step 0803 is collated with the sequence for log data sequence created in step 0801.
  • step 0805 when individual log data constituting application data is extracted as a range of application data from the sequence for log data as a result of step 0804, in step 0806, it is included in the range of application data in step 0805. Integrate log data and create records as application data.
  • step 0805 if the result of step 0804 is that the individual log data constituting the application data is not extracted as the range of the application data from the sequence for log data sequence, nothing is done. If the collation of the sequence for log data sequence is not completed in step 0807, the processing from step 0804 to step 0806 is repeated.
  • step 0807 when collation of the sequence for log data sequence is completed, in step 0808, when the inter-system data display is performed as designation of the user 0101 in the user terminal 0111, in step 0809, the system configuration information is referred to.
  • step 0810 the system configuration information in step 0809 is collated with the sequence for log data sequence created in step 0801. In step 0811, log data is thinned out as a result of step 0810.
  • step 0812 If the collation of the sequence for log data sequence is not completed in step 0812, the processing of step 0810 and step 0811 is repeated.
  • step 0812 when collation of the sequence for log data sequence is completed, in step 0813, display processing of data created up to step 0812 is performed via the user interface.
  • FIG. 9 is a diagram showing a method of displaying a sequence of log data on the user terminal.
  • 0901 is a display showing the sequence for the sequence of log data created by the processing of FIG. 7, 0902 is a display in which individual log data included in 0901 are arranged with the granularity of application data, and 0903 is between systems. It is a display of log data that can be seen as an exchange.
  • (1) to (8) in the figure correspond to (1) to (8) in FIG.
  • the application data definition information is referred to by referring to the format, size, identification information, etc. of the application data, and a plurality of log data 0911 included in the sequence array 0901 is used.
  • Log data is extracted, integrated, and rearranged (0912).
  • log data (2) at 0912 is created from log data (2) -1 to (2) -m at 0911, and log data at 0912 from log data (3) -1 to (3) -n at 0911 ( 3) has been created.
  • intersystem data display 0903 When the intersystem data display 0903 is created, information such as node roles (application processing nodes, gateways, etc.), communication paths, etc. is referred to as system configuration information from the log data 0911 included in the sequence array 0901. Thinning out and creating log data 0913 at the system granularity. For example, here, only the log data of the data source and the final destination is displayed.
  • 0102 System 1, 0103: System 2, 0112: Operation server, 0113: Processing node, 0203: Application server, 0207: Controller, 0208: User terminal, 0215: Field network, 0221: Field equipment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

 導入範囲・時期、準拠規格、ベンダ等の異なるシステムにおいて個々に蓄積及び管理されるログデータに対して、統一のインデックスを付与することは困難である。このため蓄積されたログデータからデータ及び動作の流れを追跡することは負荷がかかる。またログに出力されるデータの粒度も異なると、全てのログをユーザに提示しても、ユーザによっては理解困難もしくは不要なデータまで含まれる可能性がある。 (1)部分的な紐付け情報の組合せにより、ノード及びシステムを跨いでログをシーケンスに紐付ける。(2)アプリケーションデータの定義情報、システムの構成情報、等を参照して、送受信データ単位、アプリデータ単位、システム間データ単位、等のユーザの視点に基づく粒度での情報提示を行う。

Description

分散システムにおけるシステム動作トレース方法
 本発明は、スマートグリッドまたは電力等の分野において、ネットワークを介して相互接続した、複数の独立したノードにより構成され異なる主体のシステム間でも相互接続される分散システムを対象とする。このような分散システムにおいて、各々のノードにおける処理実行に伴い発生するログデータのフォーマット、取得方法等が異なるシステム範囲を跨いでのデータ及び動作の流れのトレースの方法に関する。
 コンピュータ・システムの運用管理(障害分析または異常現象など)を目的として、コンピュータの稼動状況を示すログ情報を収集する技術は各種開発されている。例えば特許文献1では、コンピュータの稼動状況を示すログ情報が記録されたログ情報記録部と、前記ログ情報記録部に記録されたログ情報から該ログ情報が記録された時刻と所定の文字列とを抽出し、所定の時刻形式に変換された時刻と所定のフォーマットに変換された所定の文字列とを含む汎用ログを作成する汎用ログ作成手段と、前記汎用ログ作成手段により作成された汎用ログを、前記所定の時刻形式に変換された時刻の順に記録する汎用ログ記録手段と、前記汎用ログ記録手段により記録された汎用ログを有する汎用ログ記録部と、前記汎用ログ記録部に記録された汎用ログに対応するログ情報の長さと該ログ情報中に現れる語の出現頻度とを含む特徴情報を前記ログ情報記録部から抽出する特徴情報抽出手段と、前記特徴情報抽出手段により抽出されたログ情報を図形化して前記ログ情報と共に前記所定の時刻形式に変換された時刻の順に表示する表示手段とを備えたことを特徴とするログ情報解析装置が提案されている。
特開2001-356939号公報
 本発明が対象とするのは、スマートグリッド等の分野における分散システムであり、導入範囲・時期、準拠規格、ベンダ等の異なる1つ以上のシステムが相互に接続及び連携し、システムを跨いでのデータ及び動作の流れ起こり得るシステムである。ここでは個々に蓄積及び管理されるログデータに対して、統一のインデックスを付与することは困難である。このため蓄積されたログデータからデータ及び動作の流れを追跡することは負荷がかかる。またログに出力されるデータの粒度も異なると、全てのログをユーザに提示しても、ユーザによっては理解困難もしくは不要なデータまで含まれる可能性がある。
 しかしながら、上記特許文献1に開示された技術では、時刻をインデックスとして異種のログ情報を順に表示することを行っているが、本発明が対象とするシステムでは個々のログを出力、収集する計算機間で時刻が同期しているとは限らない、また例え時刻同期処理を行っても時刻同期の粒度よりもログ発生の時刻粒度の方が細かいために、ログデータ間の統一インデックスとして時刻は使用できない。
 本発明は、上述した課題を考慮したものであって、導入範囲・時期、準拠規格、ベンダ等の異なる1つ以上のシステムが相互に接続及び連携し、システムを跨いでのデータ及び動作の流れ起こり得るシステムにおいて、システム内またはシステム間でのデータ及び動作の流れのユーザによる追跡を容易化させ、またユーザ視点に基づく粒度での情報提示を行うための、分散システムにおけるシステム動作トレース方法を提供することを目的とする。
 上記課題を解決するため、本発明は以下の構成を備える。即ち、ネットワークを介して相互接続した、複数の独立したノードにより構成され、導入範囲・時期、準拠規格、処理内容、処理対象レイヤ等が異なるハードウェアまたはソフトウェアを導入し、処理実行に伴い前記ハードウェアまたはソフトウェアの仕様、データ形式に従い、ログデータを出力、蓄積する、1つ以上のノード、前記ノードにて出力するログデータを収集、蓄積、一括管理する1つ以上の運用サーバ、該ログデータの参照やその他ユーザによる操作を行うための1つ以上のユーザ端末を含める、分散システムにおいて、前記分散システムを構成する1つ以上のノードにおいて処理実行に伴い出力されるログデータを、運用サーバに収集、蓄積するステップと、前記ユーザ端末が、ユーザ操作に従って、前記1つ以上の運用サーバからログデータを取得するステップと、前記ユーザ端末が前記1つ以上の運用サーバから取得したログデータを、ログデータ間で紐付けを行い、順番に並べるステップと、前記ユーザ端末が、前記紐付け及び順番に並べたログデータをユーザに対して表示するステップを含む。
 本発明によれば、互いに独立したノード間であっても必要なログだけを取得し参照することができる。これにより、スマートグリッドや電力等の分野において、導入範囲、導入時期、複数のシステムが相互接続する複雑化したシステムの運用者は、障害解析や稼動レポート作成時にシステム内の動作把握が容易となり、ひいては管理・保守のコスト低減、等に寄与する。
分散システムにおけるシステム動作トレース方法の利用形態の概要を示す図である。 分散システムの概要を示す図である。 分散システムを構成する各々のノードにて発生、蓄積される個々のログデータを紐付ける方法の概要を示す図である。 運用サーバ(ログデータの蓄積、管理、システム情報の管理、等を行う)のモジュール構成を示す図である。 ユーザ端末(ログデータに対する紐付け作成、表示、ユーザインタフェース提供、等を行う)のモジュール構成を示す図である。 ログデータのデータフォーマットの一例を示す図である。 ログデータの取得及び紐付け作成の処理の流れを示すフローチャートである。 紐付け後のログデータの表示の処理の流れを示すフローチャートである。 ログデータのシーケンスの表示方法を示す図である。
 図1は、本発明による分散システムにおけるシステム動作トレース方法の利用形態の概要を示す図である。
 システム1(0102)、システム2(0103)等の2つ以上のシステムが連携して動作する分散システムにおいて、システム1(0102)における処理ノード(0113、0114)におけるプログラム(0123、0124)の動作に伴い出力されるログデータ(0131、0132)、蓄積ノード0115におけるDBアクセス0125に伴い出力されるログデータ0133またはシステム2(0103)における処理ノード0117におけるプログラム0127の動作に伴い出力されるログデータ0134は、出力直後は各ノード(0113、0114、0115、0117)にて蓄積される。所定のタイミングにて自身が所属するシステムの運用サーバ(システム1であれば0112、システム2であれば0116)に収集され、ログ蓄積DB(0122、0126)に蓄積、管理される。
 ユーザ0101がユーザ端末0111のユーザインタフェース0121を用いて操作すると、運用サーバ(0112、0126)からログデータを取得して、順番に並べて表示するためのシーケンス用配列0135に該ログデータを格納し、ユーザインタフェース0121を介して表示する。
 なお、本実施例にて対象とするログデータは、例えば、メッセージ送信及び受信、DBアクセス(読み、書き)等の処理ログ、処理開始・中継のトリガーとなるオペレータ操作ログ、オペレータ業務記録等、またマスタ/スレーブ切替ログ、運転モード(オンライン、テスト、待機、等)切替ログ等の処理に関連するログである。
 図2は、本発明の適用先である分散システムの概要を示す図である。
 図1で説明したとおりシステム1(0102)とシステム2(0103)とが連携することで分散システムを構成している。主な構成要素は、現場機器(0221など)、制御コントローラ(0207)、フィールドネットワーク(0215)、広域ネットワーク(0213)、ゲートウェイサーバ(0205)、LAN(0212など)、ファイアウォールサーバ(0204)、アプリケーションサーバ(0203)、運用サーバ(0112)、ユーザ端末(0208)である。
現場機器は、制御系の現場に配置される機器である。制御コントローラは、フィールドネットワーク0215を介して現場機器0221、0222を制御する機器である。ゲートウェイサーバは、広域ネットワーク0213を介してコントローラ0207と相互接続し、システム1(0102)における広域ネットワーク0213へのゲートウェイである。ファイアウォールサーバは、システム1(0102)内のLAN0212及び0211との間のファイアウォールとなるサーバである。アプリケーションサーバは、LAN0211に接続し、データの蓄積や業務アプリケーションの実行等を行うサーバである。運用サーバは、システム1(0102)内のログデータの蓄積、システム構成情報の管理等を行うサーバである。ユーザ端末は、ユーザ0101がログデータ参照等を行うための端末である。システム2(0103)については、システム1と同様の構成を備える。
 ここで、図1で説明した構成と図2で説明した構成の関係を説明する。図1における処理ノード(0113、0114)または蓄積ノード0115は、図2におけるコントローラ0207、ゲートウェイサーバ0205、サーバ0204、サーバ0203に該当する。
 ユーザ端末0111の主なハードウェア構成は、処理装置(CPU)0231、記憶装置(メモリ、ハードディスク)0232、通信装置0233からなる。
 運用サーバ0112、サーバ0203、ゲートウェイサーバ0205、コントローラ0207も同様に処理装置(CPU)、記憶装置(メモリ、ハードディスク)、通信装置を備える。
 図3は、本発明における分散システムを構成する各々のノードにて発生、蓄積される個々のログデータを紐付ける方法の概要を示す図である。
 コントローラ0207にてアプリケーションプログラムが送信したメッセージデータは、広域ネットワーク0213、ゲートウェイサーバ0205、LAN0212、サーバ0204、LAN0211、サーバ0203、LAN0211、サーバ0204、LAN0212、ゲートウェイサーバ0206、広域ネットワーク0214、LAN0216を経由してサーバ0208へと伝達される。この際のデータの流れが図中に記載した線(0301)である。このデータの流れ0301に伴い各ノードにおける処理0302((1)~(8))は、異なる通信レイヤ(L1~L7)にて実行されるとともにログデータ0311が出力される。
 前記データの流れ0301に伴い出力されるログデータ0311のヘッダ情報0312に含まれる情報を参照してログデータ間の紐付けを行う。例えば、処理(1)と(2)のログデータは「経路ID(通信経路を識別する情報)」により紐付け、処理(2)と(3)のログデータは「TID(スレッドID)」により紐付け、処理(4)と(5)のログデータは「PID(プロセスID)」により紐付け、処理(5)と(6)のログデータは「DN(データ名称)」により紐付け、処理(6)と(7)のログデータは「PID(プロセスID)」により紐付ける。前記により個々のログデータを順次紐付けていくことで、前記コントローラ0207からサーバ0208までのデータの流れ0301に伴うログデータを抽出して順番に並べることができる。ここで同一ノード内のログは時刻情報に基づいて順番に紐付け、異なるノード間はあるノードにおけるメッセージの送信ログの次に該メッセージを受信したノードにおける受信ログを紐付ける。
 図4は、運用サーバのモジュール構成を説明する図である。運用サーバは、システム内で収集するログデータの蓄積、管理、システム情報の管理、等を行う。
 運用サーバ0112には、ログデータの収集、蓄積、管理及びユーザ端末0111への提供を行うミドルウェア0401、ログデータを蓄積するためのログデータ蓄積DB0402が導入される。
 ミドルウェア0401の主な構成要素は、データ通信部0415を介してシステム内の処理ノード(0113、0114、0115)や蓄積ノード0115等から各ノードにて発生するログデータを受け取り、ログデータ蓄積DB0402に蓄積するログデータ収集・蓄積部0411、ログデータ蓄積DB0402に蓄積されるログデータを管理するログデータ管理部0412、データ通信部0415を介してユーザ端末0111からの検索要求を受付け、ログデータ蓄積DB0402に対して該要求に対する検索実施及び該当ログデータの取出しを行うログデータ検索・取出し部0413、アプリケーションデータ定義情報0421、システム構成情報0422を管理し、データ通信部0415を介してユーザ端末0111からのアプリケーションデータ定義情報0421、システム構成情報0422に関する問合せに応答するシステム情報管理部0414、通信媒体0211を介して他のノードとの間で通信処理を行うデータ通信部0415である。
 図5は、ユーザ端末のモジュール構成を説明する図である。ユーザ端末は、システム内で収集するログデータに対する紐付け作成、表示、ユーザインタフェース提供、等を行う。
 ユーザ端末0111には、ログデータの取得及び表示データ作成、表示、等を行うミドルウェア0501、運用サーバ0112より取得し加工したログデータを一時格納するための一時データ格納領域0502、ユーザに対する情報提示及び操作を提供するユーザインタフェース0121が導入される。
 ミドルウェア0501の主な構成要素は、ユーザインタフェース実行管理部0514を介して、ユーザインタフェース0121を用いてユーザ0101が指定した範囲、条件に基づいて、データ通信部0515を介して運用サーバ0112に対してログデータの検索処理を行うログデータ検索部0511、ログデータ検索部0511から検索結果であるログデータを取得して、ログデータ間の紐付け抽出及び該紐付けに基づくシーケンス用配列の作成を行うログデータ紐付け作成部0512、ログデータ紐付け作成部0512が作成したログデータのシーケンス用配列を取得し、データ通信部0515を介して運用サーバ0112から取得するアプリケーションデータ定義情報、システム構成情報等を参照して、ユーザインタフェース0121にて表示するデータを作成する表示データ作成部0513、表示データ作成部0513が作成したデータの表示、ユーザによる入力の受付け等を実施するためにユーザインタフェース0121を制御するユーザインタフェース実行管理部0514、通信媒体0211を介して運用サーバ0112との間で通信処理を行うデータ通信部0515である。なおログデータ紐付け作成部0512、表示データ作成部0513は処理の過程で中間データ等を必要に応じて一時データ格納領域0502に格納する。
 図6は、本発明における分散システム内で使用される、ログデータのデータフォーマットの一例を示す図である。
 ログデータフォーマット0601の主な構成要素は、ヘッダ情報0611、ログデータ本体0612である。ヘッダ情報0611はログデータ本体0612に格納されるログデータを補足するための情報であり、一例として、発生時刻0621、データサイズ0622、プロセスID0623、スレッドID0624、送信元情報0625、宛先情報0626、経路情報0627、プロトコル情報0628、データ識別情報0629、業務識別情報0620、等を含める。これらの情報は全てを含められるとは限らず、ログデータの発生源である各ノードの各処理にて出力可能な情報を含める。なお前記0621~0620以外の情報が含められる場合もある。ログデータ本体0612には、各ノードの各処理にて発生するログデータ自体が格納される。
 図7は、ログデータの取得及び紐付け作成の処理の流れを示すフローチャートである。 
 ステップ0701において、ユーザ端末0111にてユーザ0101による参照するログデータの範囲、条件等の指定を受け付ける。ここでは時刻の範囲、対象計算機の範囲やログデータの種別、検索の手順、等の条件、等を指定する。ステップ0702において、ステップ0701にて受け付けた範囲、条件等に従って運用サーバ0112へのログデータの検索を実施する。ステップ0703において、ステップ0702の結果、該当するログデータを有する運用サーバ0112から該当するログデータを取得する。ステップ0704において、全ての該当するログデータを有する運用サーバ0112からのログデータ取得を完了していなければ、ステップ0702、ステップ0703の処理を繰り返す。ステップ0704において、全ての該当するログデータを有する運用サーバ0112からのログデータ取得を完了していれば、ステップ0705において、ステップ0704までに取得したログデータの中から、ユーザがユーザ端末0208にて、起点として指定するノード、時刻、処理等の条件に該当するログデータを選出する。起点となるのは処理や業務等の開始箇所でのログまたはユーザが参照したい最初の箇所のログである。
ステップ0706において、個々のログデータのヘッダ情報を参照する。ステップ0707において、ステップ0706の結果、一意となる識別情報がある場合、ステップ0708において、前記一意となる識別情報を用いて、紐付け可能なログデータを抽出し、シーケンス用の配列に格納する。ステップ0707において、ステップ0706の結果、一意となる識別情報が無い場合、ステップ0709において、シーケンス用配列に格納した最後のログデータと、その他の未格納のログデータの中で次に配列に格納すべきログデータとの間で内容の突合せを行う。
 ステップ0710において、ステップ0709の結果、紐付け可能なログデータがある場合、ステップ0711において、該当するログデータを抽出し、シーケンス用の配列に格納する。ステップ0710において、ステップ0709の結果、紐付け可能なログデータが無い場合、ステップ0712において、関連データを参照し、シーケンス用配列に格納した最後のログデータと、その他の未格納のログデータの中で次に配列に格納すべきログデータとの間の関係を抽出する。
 ステップ0713において、ステップ0712の結果、紐付け可能なログデータがある場合、ステップ0714において、該当するログデータを抽出し、シーケンス用の配列に格納する。ステップ0713において、ステップ0712の結果、紐付け可能なログデータが無い場合、何もしない。ステップ0715において、ステップ0704までに取得した全てのログデータに対して確認が完了した場合、ステップ0716において、ログデータのシーケンス用配列を完成させ、該シーケンス用配列の表示処理を行う。ステップ0715において、ステップ0704までに取得した全てのログデータに対して確認が完了していない場合、ステップ0706~ステップ0714の処理を繰り返す。
 前記ログデータ間の紐付けにおいて、一意となる識別情報としては、プロセスID、スレッドID等の情報が挙げられる。ログデータ間の内容突合せに用いるのは、送信処理におけるログデータに含まれる宛先情報、送信元情報及び通番と受信処理におけるログデータに含まれる宛先情報、送信元情報及び通番とである。またログデータの関係を抽出するための参照する関連情報として、マスタ/スレーブ切替ログ、運転モード切替ログ等である。例えば多重系を構成して並行稼動している複数の計算機においては、マスタである計算機のログでーたのみを抽出、紐付ける。また運転モードが同一である1つ以上の計算機に限定してログデータの抽出、紐付けを行う、等の処理を実施する。
 図8は、ユーザ端末での、紐付け後のログデータの表示の処理の流れを示すフローチャートである。
 ステップ0801において、図7で示したフローチャートに従って、ログデータのシーケンス用配列を完成させる。ステップ0802において、ユーザ端末0111におけるユーザ0101の指定として、アプリケーションデータ表示を行う場合、ステップ0803において、アプリケーションデータ定義情報を参照する。ステップ0804において、ステップ0803のアプリケーションデータ定義情報と、ステップ0801にて作成したログデータのシーケンス用配列とを照合する。ステップ0805において、ステップ0804の結果、ログデータのシーケンス用配列からアプリケーションデータの範囲として、アプリケーションデータを構成する個々のログデータを抽出した場合、ステップ0806において、ステップ0805のアプリケーションデータの範囲に含まれるログデータを統合して、アプリケーションデータとしてのレコードを作成する。ステップ0805において、ステップ0804の結果、ログデータのシーケンス用配列からアプリケーションデータの範囲として、アプリケーションデータを構成する個々のログデータを抽出しなかった場合、何もしない。ステップ0807において、ログデータのシーケンス用配列の照合を完了していない場合、ステップ0804~ステップ0806の処理を繰り返す。ステップ0807において、ログデータのシーケンス用配列の照合を完了した場合、ステップ0808において、ユーザ端末0111におけるユーザ0101の指定として、システム間データ表示を行う場合、ステップ0809において、システム構成情報を参照する。ステップ0810において、ステップ0809のシステム構成情報と、ステップ0801にて作成したログデータのシーケンス用配列とを照合する。ステップ0811において、ステップ0810の結果として、ログデータの間引きを実施する。ステップ0812において、ログデータのシーケンス用配列の照合を完了していない場合、ステップ0810、ステップ0811の処理を繰り返す。ステップ0812において、ログデータのシーケンス用配列の照合を完了した場合、ステップ0813において、ユーザインタフェースを介して、ステップ0812までに作成したデータの表示処理を行う。
 図9は、ユーザ端末での、ログデータのシーケンスの表示方法を示す図である。
 0901は図7の処理により作成したログデータのシーケンス用配列を示した表示であり、0902は0901に含まれる個々のログデータをアプリケーションデータの粒度にして並べた表示であり、0903はシステム間でのやり取りとして見えるログデータの表示である。図中の(1)~(8)は図3における(1)~(8)に該当する。
 アプリケーションデータ表示0902を作成する際には、アプリケーションデータ定義情報として、アプリケーションデータのフォーマット、サイズ、識別情報等を参照して、シーケンス用配列0901に含まれるログデータ0911からアプリケーションデータに該当する複数のログデータを抽出、統合して並べ直す(0912)。ここでは0911におけるログデータ(2)-1~(2)-mより0912におけるログデータ(2)を作成し、0911におけるログデータ(3)-1~(3)-nより0912におけるログデータ(3)を作成している。
 システム間データ表示0903を作成する際には、システム構成情報として、ノード役割(アプリケーション処理ノード、ゲートウェイ、等)、通信経路等の情報を参照して、シーケンス用配列0901に含まれるログデータ0911から間引きを行い、システムの粒度でのログデータ0913を作成する。例えばここではデータの発信元及び最終的な到達先のログデータのみを表示している。
0102:システム1、0103:システム2、0112:運用サーバ、0113:処理ノード、0203:アプリケーションサーバ、0207:コントローラ、0208:ユーザ端末、0215:フィールドネットワーク、0221:現場機器。

Claims (12)

  1.  複数のシステムで発生するログデータを共通に管理するログ管理方法であって、
     前記システムに接続する処理ノードが、当該処理ノードでの処理に関する情報をヘッダ情報に書き込んでログを出力するログ出力ステップと、
     前記処理ノードから前記ログを取得するログ取得ステップと、
     複数の前記取得したログのヘッダ情報から前記処理に関する情報を参照する参照ステップと、
     前記参照した前記処理に関する情報に従って、前記複数のログの順序を決定する順序決定ステップと、
     を備えることを特徴とするログ管理方法。
  2.  請求項1に記載のログ管理方法において、
     前記処理に関する情報は、処理を一意に特定する情報と、当該処理の順番が規定された情報であり、
     前記順序決定ステップは、前記処理の順番が規定された情報に基づいて前記複数のログの順序を決定することを特徴とするログ管理方法。
  3.  請求項2に記載のログ管理方法において、
     前記順序決定ステップは、前記処理に関する情報にログを一意に特定できる情報がある場合は、当該情報に基づいてログの順序を決定し、前記処理に関する情報にログを一意に特定できる情報が無い場合は、複数のログの間で内容をつき合わせることで、前記ログの順序を決定することを特徴とするログ管理方法。
  4.  ネットワークを介して相互接続した、複数の独立したノードにより構成され、導入範囲・時期、準拠規格、処理内容、処理対象レイヤ等が異なるハードウェアまたはソフトウェアを導入し、処理実行に伴い前記ハードウェアまたはソフトウェアの仕様、データ形式に従い、ログデータを出力、蓄積する、1つ以上のノード、前記ノードにて出力するログデータを収集、蓄積、一括管理する1つ以上の運用サーバ、該ログデータの参照やその他ユーザによる操作を行うための1つ以上のユーザ端末を含める、分散システムにおいて、前記分散システムを構成する1つ以上のノードにおいて処理実行に伴い出力されるログデータを、運用サーバに収集、蓄積するステップと、前記ユーザ端末が、ユーザ操作に従って、前記1つ以上の運用サーバからログデータを取得するステップと、前記ユーザ端末が前記1つ以上の運用サーバから取得したログデータを、ログデータ間で紐付けを行い、順番に並べるステップと、前記ユーザ端末が、前記紐付け及び順番に並べたログデータをユーザに対して表示するステップを含むことを特徴とする、分散システムにおけるシステム動作トレース方法。
  5.  請求項4に記載のシステム動作トレース方法において、
     分散システムを構成する1つ以上のノードにおいて処理実行に伴い出力されるログデータは、該当する処理に関連する情報を含めるログデータ本体と、該ログデータ本体を補足説明する各種の情報を含めるヘッダ情報とで構成されることを特徴とする、分散システムにおけるシステム動作トレース方法。
  6.  請求項4に記載のシステム動作トレース方法において、
     分散システムを構成する1つ以上のノードにおいて処理実行に伴い出力されるログデータは出力直後は該ノードにて蓄積しておき、所定のタイミングにて前記ノードに蓄積されているログデータを一括して運用サーバに送信し、該運用サーバにて蓄積、管理することを特徴とする、分散システムにおけるシステム動作トレース方法。
  7.  請求項4に記載のシステム動作トレース方法において、
     ユーザ端末が1つ以上の運用サーバからログデータを取得する際に、ユーザ指定により取得先の運用サーバ、またログデータの時刻範囲、種別等の条件を特定して検索することを特徴とする、分散システムにおけるシステム動作トレース方法。
  8.  請求項4に記載のシステム動作トレース方法において、
     ユーザ端末が1つ以上の運用サーバから取得したログデータを、ログデータ間で紐付けを行い、順番に並べる際に、ログデータ間で一意の識別情報がログデータのヘッダ情報等から抽出される場合、該一意の識別情報を用いてログデータ間の紐付けを実施することを特徴とする、分散システムにおけるシステム動作トレース方法。
  9.  請求項4乃至請求項8のいずれか一項に記載のシステム動作トレース方法において、
     ユーザ端末が1つ以上の運用サーバから取得したログデータを、ログデータ間で紐付けを行い、順番に並べる際に、ログデータのヘッダ情報等の内容の突合せを行い、同一事象に関するログデータであることが確認できる場合、該ログデータ間の紐付けを実施することを特徴とする、分散システムにおけるシステム動作トレース方法。
  10.  請求項4乃至請求項9のいずれか一項に記載のシステム動作トレース方法において、
     ユーザ端末が1つ以上の運用サーバから取得したログデータを、ログデータ間で紐付けを行い、順番に並べる際に、関連データを参照して、ログデータ間の関係を抽出、発見して、該ログデータ間の紐付けを実施することを特徴とする、分散システムにおけるシステム動作トレース方法。
  11.  請求項4に記載のシステム動作トレース方法において、
     ユーザ端末が、紐付け及び順番に並べたログデータをユーザに対して表示する際に、アプリケーションデータ定義情報を参照して、前記紐付け順番に並べたログデータのうち、1つのアプリケーションデータに該当する1つ以上のログデータを統合して1つのレコードとして、紐付け及び順番に並べることを再度実施することを特徴とする、分散システムにおけるシステム動作トレース方法。
  12.  請求項4乃至請求項11に記載のシステム動作トレース方法において、
     ユーザ端末が、紐付け及び順番に並べたログデータをユーザに対して表示する際に、システム構成情報を参照して、前記紐付け順番に並べたログデータのうち、ユーザが指定する粒度での表示となるように前記紐付け及び順番に並べたログデータの間引きを行うことを特徴とする、分散システムにおけるシステム動作トレース方法。
PCT/JP2012/075002 2012-09-28 2012-09-28 分散システムにおけるシステム動作トレース方法 WO2014049804A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US14/419,874 US20150169288A1 (en) 2012-09-28 2012-09-28 System operation tracing method on distributed system
EP12885860.2A EP2902908A4 (en) 2012-09-28 2012-09-28 METHOD OF TRACING SYSTEM OPERATIONS IN A DISTRIBUTED SYSTEM
PCT/JP2012/075002 WO2014049804A1 (ja) 2012-09-28 2012-09-28 分散システムにおけるシステム動作トレース方法
JP2014537973A JPWO2014049804A1 (ja) 2012-09-28 2012-09-28 分散システムにおけるシステム動作トレース方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/075002 WO2014049804A1 (ja) 2012-09-28 2012-09-28 分散システムにおけるシステム動作トレース方法

Publications (1)

Publication Number Publication Date
WO2014049804A1 true WO2014049804A1 (ja) 2014-04-03

Family

ID=50387267

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/075002 WO2014049804A1 (ja) 2012-09-28 2012-09-28 分散システムにおけるシステム動作トレース方法

Country Status (4)

Country Link
US (1) US20150169288A1 (ja)
EP (1) EP2902908A4 (ja)
JP (1) JPWO2014049804A1 (ja)
WO (1) WO2014049804A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110574012A (zh) * 2017-02-08 2019-12-13 华为技术有限公司 使用分布式执行跟踪的故障管理系统和方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5630551B1 (ja) * 2013-10-07 2014-11-26 富士ゼロックス株式会社 情報提供装置、情報提供システム及びプログラム
JP6862081B2 (ja) * 2015-06-23 2021-04-21 キヤノン株式会社 ロボットシステムの制御方法、制御プログラム、コンピュータ読み取り可能な記録媒体、およびロボットシステム
CN105677552A (zh) * 2016-01-04 2016-06-15 杭州亚美利嘉科技有限公司 一种机器人日志管理方法及服务器
CN105743709A (zh) * 2016-04-05 2016-07-06 浪潮电子信息产业股份有限公司 一种管理装置、整机柜管理系统和管理方法
US10678802B2 (en) 2016-06-15 2020-06-09 International Business Machines Corporation Log management utilizing time context indexing
US10114857B1 (en) 2017-11-13 2018-10-30 Lendingclub Corporation Techniques for performing multi-system computer operations
US11354301B2 (en) 2017-11-13 2022-06-07 LendingClub Bank, National Association Multi-system operation audit log
CN109408337B (zh) * 2018-10-31 2021-12-28 京东方科技集团股份有限公司 一种接口运维的方法及装置
US10628242B1 (en) 2018-12-24 2020-04-21 Lendingclub Corporation Message stream processor microbatching
US11170029B2 (en) 2019-05-31 2021-11-09 Lendingclub Corporation Multi-user cross-device tracking
CN114500255B (zh) * 2022-03-01 2024-03-15 北京百度网讯科技有限公司 一种日志数据上报方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145117A (ja) * 1997-07-25 1999-02-16 Mitsubishi Electric Corp メッセージ表示システム
JP2001184235A (ja) * 1999-12-24 2001-07-06 Hitachi Ltd ログ情報取得解析装置
JP2001356939A (ja) 2000-06-13 2001-12-26 Tokyo Electric Power Co Inc:The ログ情報解析装置、方法および記録媒体
JP2002041330A (ja) * 2000-07-24 2002-02-08 Nec Corp センタ監視システムおよびそのログ管理方法
JP2008204211A (ja) * 2007-02-21 2008-09-04 Nomura Research Institute Ltd ログ蓄積装置、ログ蓄積方法、プログラム、および記録媒体
JP2010287142A (ja) * 2009-06-15 2010-12-24 Hitachi Ltd フォールトトレラントコンピュータシステムおよびフォールトトレラントコンピュータシステムにおける方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10333943A (ja) * 1997-05-27 1998-12-18 Mitsubishi Electric Corp 計算機システムのトレース・ログ処理方法とその処理装置
JP3614625B2 (ja) * 1997-10-27 2005-01-26 株式会社日立製作所 管理マネージャ計算機、記録媒体、および、計算機運用管理方法
CA2419305C (en) * 2003-02-20 2006-03-21 Ibm Canada Limited - Ibm Canada Limitee Unified logging service for distributed applications
US20070011300A1 (en) * 2005-07-11 2007-01-11 Hollebeek Robert J Monitoring method and system for monitoring operation of resources

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145117A (ja) * 1997-07-25 1999-02-16 Mitsubishi Electric Corp メッセージ表示システム
JP2001184235A (ja) * 1999-12-24 2001-07-06 Hitachi Ltd ログ情報取得解析装置
JP2001356939A (ja) 2000-06-13 2001-12-26 Tokyo Electric Power Co Inc:The ログ情報解析装置、方法および記録媒体
JP2002041330A (ja) * 2000-07-24 2002-02-08 Nec Corp センタ監視システムおよびそのログ管理方法
JP2008204211A (ja) * 2007-02-21 2008-09-04 Nomura Research Institute Ltd ログ蓄積装置、ログ蓄積方法、プログラム、および記録媒体
JP2010287142A (ja) * 2009-06-15 2010-12-24 Hitachi Ltd フォールトトレラントコンピュータシステムおよびフォールトトレラントコンピュータシステムにおける方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2902908A4

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110574012A (zh) * 2017-02-08 2019-12-13 华为技术有限公司 使用分布式执行跟踪的故障管理系统和方法
US11048572B2 (en) 2017-02-08 2021-06-29 Huawei Technologies Co., Ltd. System and method for failure management using distributed execution traces

Also Published As

Publication number Publication date
JPWO2014049804A1 (ja) 2016-08-22
EP2902908A4 (en) 2016-07-06
US20150169288A1 (en) 2015-06-18
EP2902908A1 (en) 2015-08-05

Similar Documents

Publication Publication Date Title
WO2014049804A1 (ja) 分散システムにおけるシステム動作トレース方法
CN111522922B (zh) 日志信息查询方法、装置、存储介质及计算机设备
CN109660397B (zh) 用于采集日志的系统、方法和装置
US9262248B2 (en) Log configuration of distributed applications
US8792385B2 (en) Method and device for auto-generating goose signal connection topology from substation level
JP5542859B2 (ja) ログ管理装置、ログ蓄積方法、ログ検索方法、およびプログラム
JP2005346414A (ja) トレース処理プログラム、方法及び装置
CN102752294B (zh) 基于设备能力的多终端数据同步方法和系统
US20130198333A1 (en) Method and device for recording and reproducing web operation
JP4627539B2 (ja) 負荷試験システムおよび負荷試験データ作成方法、ならびにそのプログラム
CN109802842B (zh) 应用拓扑的生成方法及相关设备
CN112506969A (zh) 一种bmc地址查询方法、系统、设备及可读存储介质
CN114356692A (zh) 一种应用监控链路的可视化处理方法、装置及存储介质
CN112445861B (zh) 信息处理方法、装置、系统及存储介质
CN106713011A (zh) 一种获取测试数据的方法与系统
CN102571424A (zh) 一种工程事件处理方法、装置和系统
JP2014035595A (ja) 通信システムの試験装置、通信システムの試験用プログラム及び通信システムの試験方法
CN104539449B (zh) 一种故障信息处理方法与相关装置
JP2018036971A (ja) 計算機システム及びテストケース管理方法
CN116483591A (zh) 应用于微服务架构的数据处理方法、装置、介质及设备
CN111817867A (zh) 分布式环境下进行多日志协同分析的方法及系统
CN104881411B (zh) 存储系统间文件的处理方法及装置
JP5901962B2 (ja) コマンド処理システム及び方法
CN109684158A (zh) 分布式协调系统的状态监控方法、装置、设备及存储介质
EP3349127A1 (en) Category information generating device, category information generating method, search device, search method, and recording medium

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12885860

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014537973

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14419874

Country of ref document: US

REEP Request for entry into the european phase

Ref document number: 2012885860

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2012885860

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE