2022-09-03

python - リファレンス

Python

言語リファレンス

Python 言語リファレンス — Python 3.10.6 ドキュメント

標準ライブラリ

https://docs.python.org/ja/3/library/index.html#library-index

2022-09-03

vscode - コードチェッカー、フォーマッター

VS code Python

インストール

コードチェッカー、フォーマッターのインストール

conda install -c conda-forge flake8 black isort mypy

pip install flake8 black isort mypy

vs codeでの設定

Work spaceを作る場合はworkspaceのsetting.jsonを以下の通り

{
    "python.linting.flake8Enabled": true,
    "python.formatting.provider": "black",
    "editor.formatOnSave": true,
    "editor.codeActionsOnSave": {
        "source.organizeImports": true
    },
    "python.linting.mypyEnabled": true,
    "python.linting.flake8Args": [
        "--max-line-length=88",
        "--ignore=E203,W503,W504"
    ],
}

References

Pythonによるパッケージ開発 | フューチャー技術ブログ (blackと干渉するflake8でのE203の回避方法）環境構築について丁寧に書かれているのでこれ以外にも参考になりそう。

2022-09-02

unix - コマンドの標準出力を変数として使用する

unix

コマンドの標準出力を変数として使用する

コマンドの出力を変数に設定したい場合は、 (バッククォート) を使用する

$ VAR=`date "+%Y-%m-%d"`
$ echo $VAR
2022-09-02

References

変数を使用する | UNIX & Linux コマンド・シェルスクリプトリファレンス

2022-09-02

tar - フォルダの圧縮・解凍

unix

フォルダの圧縮・解凍

フォルダの圧縮

$　tar -czvf directory.tar.gz directory

-c : アーカイブを作成する
-z : アーカイブファイル名を指定する
-f : gzipでの圧縮を指定
-v : 処理しているファイル情報を出力

フォルダの解凍

$　tar -xzf archive_name.tar.gz

-x : アーカイブの展開
-z : gzipでの解凍を指定
-f : アーカイブファイル名archive_name.tar.gz を指定する

References

2022-08-13

Python - 辞書型データのdot notation

Python

`SimpleNamespace`

>>> from types import SimpleNamespace
>>> d = {'key1': 'value1', 'key2': 'value2'}
>>> n = SimpleNamespace(**d)
>>> print(n)
namespace(key1='value1', key2='value2')
>>> n.key2
'value2'

References

dictionary - How to use dot notation for dict in python? - Stack Overflow

2022-08-03

Python - ファイル名の変更

Python

ファイル名の変更(`os.rename`)

ファイルから作成日の情報を取り出して、'yymmdd'の形式でファイル名の最初につける。

ファイル名の変更: os.rename

# ファイルから作成日の情報を取り出して、'yymmdd'の形式でファイル名の最初につける

import os
from datetime import datetime
from glob import glob

def get_dateStr(path: str, system_type='unix'):
    if system_type=='unix':
        c_timestamp = os.stat(path).st_birthtime
    else:
        c_timestamp = os.path.getctime(path)    # for Windows PC

    dt = datetime.fromtimestamp(c_timestamp)
    date_str = datetime.strftime(dt, '%y%m%d')
    return date_str

def rename_cdate(path: str):
    data_str = get_dateStr(path)
    rm_file_name = f"{data_str}_{os.path.basename(path)}"
    rm_path = os.path.join(os.path.dirname(path), rm_file_name)
    os.rename(path, rm_path)

if __name__ == '__main__':
    path_list = glob('*.md')
    for path in path_list:
        rename_cdate(path)

ファイル名の冒頭に作成日(yymmdd)をつけてrename · GitHub

2022-08-02

python - 自作のスクリプトをimportして使う

Python

自分で書いたPythonスクリプトをimportして使う

スクリプトファイル自身のpathからの相対pathを`sys.path`に登録

__file__でスクリプトファイル自身のpathを参照できるので、これを利用する。

import os
import sys

# スクリプト自身のpathから一階層上のディレクトリをsys.pathに加える。
sys.path.append(os.path.join(os.path.dirname(__file__), '..')

References

Pythonでimportの対象ディレクトリのパスを確認・追加（sys.pathなど） | note.nkmk.me

2022-08-02

Bizmates channel

英語学習

英語初心者向け　英文法10分聞き流し

www.youtube.com

References

ビジネスを成功に導く英会話学習の旅を楽しくする、動画チャンネル。 Bizmates Channel

2022-07-06

DOIにマッチする正規表現

文献情報正規表現

以下の正規表現で99%以上のDOIは識別されるとのこと。さらにカバー率を上げるにはrefを参考に追加で4つのパターンを加える。それでもマッチできないものは僅かに残るとのこと。

/^10.\d{4,9}/[-._;()/:A-Z0-9]+$/i

References

DOIにマッチする正規表現（記事紹介） | カレントアウェアネス・ポータル

2022-07-05

python - xmlファイルを辞書型、json形式に変換

Python

conda install -c conda-forge xmltodict

上記でインストール

import xmltodict
import json

with open('data.xml', 'r') as f:
    xml_data = f.read()

dictionary = xmltodict.parse(xml_data)
json_object = json.dumps(dictionary) 
print(json_object)

References

2022-07-05

unix - 上書き防止

unix

以下の設定をしておく。上書き防止対策。

set -o noclobber

2022-07-04

NCBI E-utilitiesからの情報の取得例 (E-utilities URL)

文献情報

注意点

API keyなしでは3回/秒までのリクエスト。（API keyありで10回/秒がデフォルト）この条件を超えないようにすること。これ以上のアクセスが必要な場合はNCBI所定の登録が必要

A General Introduction to the E-utilities - Entrez Programming Utilities Help - NCBI Bookshelf

NCBIのE-utilitiesからデータを取得したいときのURLのsyntax

www.ncbi.nlm.nih.gov

E-Fetch

PMIDからabstractを取得したり、PubMed centralのfull textデータ取得の場合の例などは下記に記載されている。

The E-utilities In-Depth: Parameters, Syntax and More - Entrez Programming Utilities Help - NCBI Bookshelf

例

PubMed

Fetch PMIDs 17284678 and 9997 as text abstracts:

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&id=17284678,9997&retmode=text&rettype=abstract

Fetch PMIDs in XML:

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&id=11748933,11700088&retmode=xml

PubMed Central

Fetch XML for PubMed Central ID 212403:

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pmc&id=212403

参考

使用できるdbとデータ型の一覧

https://www.ncbi.nlm.nih.gov/books/NBK25499/table/chapter4.T._valid_values_of__retmode_and/?report=objectonly

言語リファレンス

標準ライブラリ

インストール

vs codeでの設定

References

コマンドの標準出力を変数として使用する

References

フォルダの圧縮

フォルダの解凍

References

SimpleNamespace

References

ファイル名の変更(os.rename)

自分で書いたPythonスクリプトをimportして使う

スクリプトファイル自身のpathからの相対pathをsys.pathに登録

References

英語初心者向け 英文法10分聞き流し

Contents

References

References

References

注意点

NCBIのE-utilitiesからデータを取得したいときのURLのsyntax

E-Fetch

例

PubMed Central

参考

`SimpleNamespace`

ファイル名の変更(`os.rename`)

スクリプトファイル自身のpathからの相対pathを`sys.path`に登録

英語初心者向け　英文法10分聞き流し