グラフデータベースの選定

グラフデータベースは頂点間の関連性をデータ構造として保持し実用的な時間内にグラフとしてレポートするタイプのデータベース。

使い倒す前にどういうデータベースがあるのか調べた。

グラフデータベース一覧

製品名アクセス方法無償
Open
商用可
RDF
構造
操作言語
AllegroGraphWEBNONOYESProlog
/SPARQL
Amazon NeptuneWEB/GremlinNONOYESTinkerPop
/Gremlin/SPARQL
AnzoGraph DBWEBYES
NOYESYESCypher
/SPARQL
ArangoDBWEBYESYESYES未記載AQL
/JavaScript
DataStax Enterprise GraphWEB
(DataStax Studio)
NONO未記載Gremlin
/Tinkerpop
DgraphWEBYESYESYESYESDQL
/GraphQL
Grakn CoregRPCYESYESYES未記載Graql
InfiniteGraph未確認NONO未記載未確認
JanusGraphGremlinYESYESYES未記載Gremlin
LEMONライブラリYESYESYES未記載
MarkLogic未確認NONOYES未確認
Microsoft SQL Server 2017未確認未確認NO未確認Transact-SQL ?
Nebula GraphWEB
Nebula Graph Studio利用
YESYESYES未記載nGQL
Neo4jWEBYES
NO未記載Cypher
NetworkXWEBYESYESYES未記載Python
OpenLink VirtuosoWEBYES
両版有
YES
両版有
YES
両版有
YESSPARQL
/XQuery
/XPath 1.0のみ/XSLT 1.0のみ 
Oracle RDF Graph; part of Oracle Database未確認未確認未確認未確認YES未確認
Oracle Property Graph; part of Oracle Database未確認未確認未確認未確認未確認未確認
OrientDBWEB/AppYESYESYES未記載Gremlin
/TinkerPop
RedisGraph未確認YESYESYES未記載Cypher
SAP HANA未確認未確認NO未記載Cypher
Sones GraphDB未確認未確認未確認未確認未確認未確認
Sparksee未確認YES
NO未確認未確認
Sqrrl Enterprise未確認未確認未確認未確認未確認未確認
Teradata Aster未確認未確認未確認未確認未確認未確認
TerminusDBWEBYESYESYESYESWOQL
TigerGraphWEB
GraphStudio UI
NONO未記載GSQL
Trinity Graph Engine未確認未確認未確認未確認未確認未確認
list of graph databases

幅が狭すぎてエクセル資料の情報を結構削ってしまったが、何か一つグラフデータベースを使って学んでみるという段階で重要なのは有償か無償か、次にオープンソースか否か、更に商用利用可能かどうかというところだと思う。

次に必要なのは実装方法か。Javaで出来ているか否かはまあまあ重要で、もともとサーバー上でJavaを使っているなら「しめしめJVMに間借り出来るぞ」という気持ちになるだろうし、使っていなければ「無暗にミドルウェア増やさなきゃいけないしメモリが無駄になるではないか」という気持ちにもなるだろう。

  • Grakn Core, JanusGraph, Neo4j, OrientDB, Sqrrl Enterprise はJava実装
  • Sqrrl Enterpriseは破産により開発終了
  • Trinity Graph Engine はMicrosoft Graph Engineが承継?

HAや細かい認証機能、ドキュメント・RDFのストアに対応しているかなどの考慮は後回し。

操作言語

言語概要利用言語例
AQLArangoDBでドキュメント・グラフに用いるSQL風クエリ言語ArangoDB
CypherアドホックやSQL風なプログラミングの処理を実現する宣言型グラフクエリ言語 
DQLDgraph Query Language. GraphQLのDgraph拡張機能への対応Dgraph
GraphQLオープンソースのAPI向けデータクエリ&処理言語。ISOなのでSQLのグラフデータベース版の立ち位置。GQLとも。Dgraph
GraqlGrakn’s declarative reasoning (through OLTP) and analytics (through OLAP) query languageの略。Grakn Core
GremlinApache TnkerPopのオープンソースプロジェクトの一部である、グラフプログラミング言語 
nGQLnebula Graph Database 独自のSQL風処理言語nebula graph database
SPARQLRDF向けのクエリ言語。RDFフォーマットデータの処理に利用する 
GSQLSQL風のGraph Query Language。TigerGraph
WOQLWeb Object Query Languageの略。WOQLは強力で洗練されたクエリ言語であり、任意のデータ構造で複雑なパターンを簡潔に表現できる。コアとなる基本的概念が簡素なため表現力豊かで使いやすいTerminusDB
list of languages

もう一つ重要な要素が操作言語である。グラフデータベースはそれぞれデータ構造・実装昨日が異なるためか、データ操作用の言語が乱立している印象がある。

その中でも汎用性が高そうなのはCypher、GraphQL、Gremlin, SPARQL。以下のような棲み分けになるのだろう。

  • GraphQLはISO標準のSQL風クエリ
  • Cypherは先駆者Neo4j作のため利用が多いSQL風クエリ
  • Gremlinはプログラミング時の標準コマンド
  • SPARQLはRDF処理の標準クエリ

選定結果

Java なし派だからDgraph, Nebula Graph, TerminusDBが良いと思った。しかしまだ最後まで絞り切れていないのだ。

試しにDgraphを使ってみようと思っている。

限界状態でのシステム開発マネジメント

普通は「ちゃんとスケジュールを引き直そう」とか「ヒアリングしてより業務に適した人材配置転換しよう」とか「増員してなんとか期限までに終わらせよう」とか、進捗が芳しくない時の改善はセオリーがある。
けれど、限界状態ではそれが当てはまらない。

限界状態とは

具体的にはこういう状態を指す。

  • 他との兼ね合い・契約の都合によりスケジュール・期限をずらせない
  • 人員誰もがフル稼働
  • 人員増加したとしても期限まで時間が短く必要知識の学習が間に合わない
  • 有意義な期間内に引継ぐ時間を確保できない
  • 業務改善しようにも目前の業務締め切りのためヒアリングの時間を作れない

「そんなの進捗管理すれば起こるわけないでしょ」と思うかもしれないけれど、本当に起こる怖い話なのだ。

どう対処すべきか?

最も重要なのはタスク管理の工数を考慮に入れつつ作業効率をなるべく維持出来るように優先度の高いタスクから終わらせていくことだ。

タスク管理の工数を考慮に入れるとは

確認時に2分で終わると判断できる対応は、後のToDoに残す工数の方が無駄である。こういう雑多な対応は本来の「優先度」という意味では低いタスクでも、プールせずに終わらせて元の業務に戻った方が合理的である。

例えば YES/NO を返信するだけで済むメールはその場で終わらせた方が良いという意味である。

作業効率をなるべく維持出来るようにとは

最もいけないのが「別件で資料を作成してくれ」「状況を一時間毎に報告してくれ」など、顧客や進捗管理者がキーとなる作業要員の作業時間を食いつぶしてしまい、終わるはずの作業が終わらなくなることだ。

つまり、進捗管理者は顧客に求められた頻度で報告をしていると期限内に終わらないという場合は、「かくかくしかじかのため○○の頻度で報告します。それ以上の頻度は作業に影響があるため間に合わないリスクが高まります」と言いきりどうするか伺うべきだ。

進捗管理者がまきとれること

最優先タスクが何かの確認は必須だが、それ以外のタスク確認・状況ヒアリングなどは極力避け、作業者から巻き取るべきだ。
リスケジュール出来そうな事項はリスケジュールする、人を増やせば取り掛かれる・対応できるタスクには別人員をアサインする、作業している人員の効率の妨げになっている事項があれば解消するなどの対応はした方が良い。

この施策後にもう期限に間に合わない状態となれば、もうその時は天命を待つ他ない。

強く主張したいこと

細やかな進捗管理が必要なのは進捗状況を管理下においていつまでに何をせねばならないか明確にすべき時のこと、稼働に余裕が存在する場合の話であって、この場合マネージメントは大きな意味を持つ。
けれどフルに稼働していて調整している余裕もない場合では直近の作業に全振りすべきであって、ベストエフォートで稼働を要すのが明らかならタスクマネージメントの大切さは相対的に下がるということなのだ。

2020年8月のMovable Typeインストールの流れ

Movable Type を前回使ったのは10年程前だろうか。久しぶりに試したヴァージョン7は凄くいい感じ。

特に大きく躓かず導入出来たのは○、編集しやすくなっていたのは◎。

昔はPHPで動的に生成した方が楽だと思っていたけれど、最近は違うものの見方もするようになった。

ビジネス用途ではリスク回避は非常に重要な観点になる。静的に生成して同期させるだけの方が低負荷&シンプル構成で安定性高く運用出来る⇒サーバー台数を節約出来るってメリットがある。

導入しやすさ・対応ミドルウェアは正直なところWORDPRESSと比較すると勝てない気がしている。nginx + Perl-FPM環境を作って利用してみたいと思ったけれど、1日かけて実現できなかったから諦めることにした。

2020年8月時点で正常に行えたインストールの流れを載せておく。

テスト用サーバー導入環境

CentOS 7 (Minimal) on Windows 10

以下ソフトウェアで実現する

  • apache
  • perl (CGI)
  • MariaDB

テスト用サーバー導入手順

# SELinux 無効化

vi /etc/selinux/config
#SELINUX=enforcing
#↓
#SELINUX=disabled

# httpd + perl

yum upgrade -y
yum install -y httpd httpd-devel
yum install -y http://rpms.famillecollet.com/enterprise/remi-release-7.rpm yum-utils
yum-config-manager --enable remi-php74
yum install -y php perl gcc \
    libxml2-dev \
    libssl-dev \
    libexpat1-dev \
    cpan \
    make \
    perl-HTML-Parser \
    perl-Digest-MD5 \
    perl-DBD-MySQL \
    perl-IO-Socket-SSL \
    perl-Net-SSLeay.x86_64 \
    perl-XML-LibXML.x86_64 \
    ImageMagick-perl.x86_64 \
    perl-Crypt-SSLeay
curl -L http://cpanmin.us | perl - App::cpanminus
cpanm CGI Image::Size CGI::Cookie LWP::UserAgent parent HTML::Entities \
    Archive::Tar \
    Archive::Zip \
    Cache::Memcached \
    Mozilla::CA \
    XML::Parser \
    XML::SAX::Expat \
    XML::SAX::ExpatXS \
    YAML::Syck
chown -R apache:apache /var/www/html/
chown -R apache:apache /var/www/cgi-bin/
chmod -R 755 /var/www/cgi-bin/
# CGI有効化
vi /etc/httpd/conf/httpd.conf
# cgi-bin ディレクトリディレクティヴ を修正
#    AllowOverride None
#    Options None
#    Require all granted
#↓
#    AllowOverride None
#    Options ExecCGI
#    Require all granted

systemctl start httpd
systemctl enable httpd
firewall-cmd --permanent --zone public --add-service http
firewall-cmd --reload

# mariadb

curl -sS https://downloads.mariadb.com/MariaDB/mariadb_repo_setup | sudo bash
yum install -y MariaDB-server
vi /etc/my.cnf.d/server.cnf
#[mariadb] に以下を追加
#character-set-server=utf8mb4

systemctl enable mariadb
systemctl start mariadb

# DBユーザー作成
mysql -uroot
CREATE DATABASE mt;
CREATE USER mt@localhost IDENTIFIED BY 'test';
GRANT ALL PRIVILEGES ON mt.* TO mt@'localhost';
FLUSH PRIVILEGES;

# Movable Type 配置

yum install -y unzip
mkdir /var/www/source
# ここで source 内に MT7-R4608.zip をアップロード
cd /var/www/source
unzip MT7-R4608.zip
mv MT7-R4608/mt-static/* /var/www/html/
mv MT7-R4608 /var/www/cgi-bin/mt
chown -R apache.apache /var/www/cgi-bin/mt
chmod -R 755 /var/www/cgi-bin/mt
chmod -R 777 /var/www/html/support/

# IPアドレス確認
ip addr show

# 環境情報確認
# 以下URLにアクセスしインストール可能を確認する
# http://<IP_ADDRESS>/cgi-bin/mt/mt-check.cgi

# インストール
# 以下URLにアクセスし必要情報を入力⇒インストール
# http://<IP_ADDRESS>/cgi-bin/mt/mt-wizard.cgi
# スタティックウェブパス:/
# スタティックファイルパス:/var/www/html/
# データベース名:test
# ユーザー名:mt
# ~中略~(適宜入力)
# アカウントの作成
# ユーザー名:admin
# パスワード:testtest

# 動作確認
# 以降以下URLにアクセスすればよい
# http://<IP_ADDRESS>/cgi-bin/mt/mt.cgi